林锐去前台退明天的房间。苏哲独自在房间里翻看陈默今天下午传来的一份文件——原本打算在飞机上看的,结果全程在回各种电话,一页都没翻。
文件标题让他停住了。
《基于盘古系统的工业级大语言模型可行性分析》。
他坐在床沿上,从第一页开始看。
报告的第一句话:“当算力网络铺设完成,我们将具备训练全球个工业垂直大模型的能力。”
苏哲把报告放在膝盖上,盯着天花板的灯看了十秒。
然后他拿起手机,拨了陈默的号码。
“你这份报告——认真的?”
“认真的。”陈默那头的背景音是键盘声,哒哒哒的,一直没停过。
“明天回京海。当面说。”
陈默从敦煌飞回京海的航班晚点了四十分钟。
他到苏哲办公室的时候下午三点半,双肩包里除了笔记本电脑,还多了一个东西——一只半旧的平板,屏幕上跑着一个简陋的对话框界面。
苏哲在处理另一件事。林锐示意陈默先坐。
五分钟后苏哲挂了电话,转过身来。
陈默没寒暄。他打开平板,把屏幕转向苏哲。
“我在敦煌的时候,用盘古系统现有的工业数据训练了一个原型模型。很粗糙,参数量只有七十亿,跟正式版本没法比。但能说明问题。”
他在对话框里打了一行字:设计一个能承受oo公斤负载的铝合金支架,安装空间不过oxoxo厘米。
回车。
平板的散热风扇转了起来。屏幕上的光标闪了十八秒。
然后一个三维模型从对话框下方浮了出来——铝合金支架,四角加强筋,底部法兰固定孔。旁边跟着一串参数表:材料选型o-t,壁厚,安全系数。再往下是应力分析云图和一份三步加工工序卡。
苏哲把平板拿过来,放在手里翻了翻那个三维模型。模型可以用手指旋转和缩放。
“十八秒?”
“十八秒。正式版如果跑在四节点的算力网络上,预估不过五秒。”
苏哲把平板放回桌上。
“这东西如果做出来,全世界一半的工程师会失业。”
陈默推了推眼镜:“不是失业。是升级。以前一个资深结构工程师做这个方案要两天。现在五秒钟出初稿,工程师的精力可以集中在审查和优化上。效率翻几十倍。”
“训练这个模型需要什么?”
“数据。”陈默把报告翻到第十一页,上面有一张曲线图,“模型的能力跟训练数据量的关系不是线性的——在达到一个阈值之前,模型的表现很平庸。越过阈值之后会出现能力涌现。根据我的估算,工业大模型的涌现阈值大约在一亿组高质量设计案例。”
“你现在手里有多少?”
“盘古造物系统自身积累的用户数据,大约两百万组。加上陈默研究所这些年攒的公开数据集,凑到三百万组顶天了。”
苏哲看了他一眼。
“差多少你自己心里有数。”
“差九千七百万组。”
这个数字在办公室里挂了几秒,像一个没人想碰的重物。
杨青被叫来的时候,脸上的水泡又起了一颗新的——上一颗刚好,这颗长在了嘴角另一侧。他现在两边嘴角对称地各有一个红点,像被什么东西叮过。
“数据共享倡议?”杨青听完需求,脑子转得快,“直接给十二万家企业?”
“先通知,摸底意愿。”苏哲说。