收购nba球队的事刚告一段落,玛格丽特就打电话来了。
“福田,你投的那家ai公司,出事了。”
福田正在洛杉矶的酒店里收拾行李,准备回东京。听到这话,他把衣服放下,说:“什么事?”
玛格丽特说:“不是坏事。是好事。他们的模型跑通了。你赶紧过来看看。”
福田挂了电话,改签了机票,当天下午就飞到了硅谷。
那家ai公司叫neurald,在帕洛阿尔托的一个共享办公空间里,租了三个小房间。福田第一次见他们的时候,公司只有六个人,挤在两张桌子上写代码。创始人叫alex,是个三十出头的华裔,it博士,在谷歌干了两年受不了大公司的bureaucracy,跑出来自己创业。
福田第一次见alex是在玛格丽特组织的一个路演上。alex上台讲他的大语言模型,讲得磕磕巴巴的,ppt也做得不好看,底下的投资人都在玩手机。但福田用系统分析了他的技术架构,发现有一些很有意思的东西——他在模型里加入了一种新的注意力机制,理论上可以把训练效率提升百分之三十以上。
路演结束之后,福田去后台找他。alex正在收拾东西,垂头丧气的。
“alex,你的模型,我感兴趣。”
alex抬起头,看着福田,眼神里有意外,也有警惕。“你是哪个基金的?”
福田说:“我自己。福田集团。”
alex显然没听说过福田集团,但他也没拒绝。两个人聊了一个多小时,福田把系统分析出来的几个技术问题跟他对了对,alex的眼睛越来越亮。
“你怎么看出来的?这些问题我连我的联合创始人都没说过。”
福田说:“我做过一些研究。你的注意力机制很有意思,但你的训练数据不够。大语言模型需要海量数据,你现在的规模,不够。”
alex叹了口气,说:“我知道。但要扩大规模,需要钱。我见了很多投资人,他们都说技术不错,但太早了,等有了产品再找他们。”
福田说:“你需要多少?”
alex愣了一下,说:“你要投?”
福田说:“对。你需要多少?”
alex想了想,说:“五百万美金。够我们跑一年,把模型训练出来。”
福田说:“我给你一千万。但我要百分之三十的股份。”
alex看着他,说:“你疯了?一千万买百分之三十,估值三千多万。我们上一轮才估值八百万。”
福田说:“上一轮是上一轮。你现在的技术,值这个价。”
alex沉默了很久,然后伸出手,说:“成交。”
那是八个月前的事。
现在,neurald已经从一个六人的小团队,发展成了四十多人的公司。alex在帕洛阿尔托租了一栋小楼,有自己的办公室和gpu机房。福田每隔两周会来一次,跟他们讨论技术进展和产品方向。
福田到neurald的时候,alex正在会议室里等他。桌上摊着几台电脑,屏幕上显示着各种数据和图表。的眼睛红红的,头发乱糟糟的,但整个人很兴奋,像打了鸡血一样。
“福田先生,你看这个。”他把福田拉到电脑前,调出一段对话记录。
福田看了看,是模型跟测试人员的对话。测试人员问了一个很刁钻的问题,模型的回答逻辑清晰,引经据典,甚至带了一点幽默感。
“这是我们的新模型,neurald-3。参数规模一千二百亿,训练数据两万亿token。在测试上,得分百分之八十七点三。超过了gpt-4。”
福田用系统分析了一下数据。alex没有骗人,数据是真实的。不仅真实,而且保守了。系统给出的评分是百分之八十九点一,比alex报的