返回

第397章 这个黄毛,他懂AI

首页
关灯
护眼
字:
上一页 回目录 下一章 进书架


    连人家巨头一个零头都不到的训练成本,却打出了一个在各项核心测试上媲美甚至超越上亿美金模型的极限成绩,一纸报告,直接让全世界的同行闭嘴。

    这其中的差距,用个最通俗易懂的比喻来说:

    同样是做一桌极其复杂的满汉全席,硅谷巨头就像是个不差钱的傻大款,花天价雇了十万个米其林三星主厨。

    结果呢?

    不管是烹饪极品鲍鱼,还是在后厨切大葱、洗盘子,全都让这帮拿着天价年薪的主厨去干。

    而DeepSeek的打法,是极其精打细算的“扫地僧”。

    它只留极少部分核心主厨在最关键的位置,剩下的全是切菜工和帮厨。

    系统一旦拿到任务。

    点个拍黄瓜,直接丢给切菜工去干;点个佛跳墙,主厨才下场。

    它通过极简的底层算力优化和MOE(混合专家架构),绝不浪费哪怕一滴多余的算力。

    顾屿当时读完那份报告,在椅子上坐了很久。

    不是看不懂。

    是看懂了,才明白。

    那场属于AI时代的终极竞赛,从来不是比谁的肌肉更大,不是比谁更有钱,而是比谁浪费得更少。

    任少卿跑的这条路,在2013年是对的。

    但终点在哪,他恐怕想不到。

    “你现在做的东西,”

    顾屿收回目光,看向任少卿,

    “在2013年是对的。但沿这条路走下去,十年后,你会碰到一堵墙。”

    “什么墙?”

    “规模的边际效益递减。”

    顾屿顿了顿,把那套逻辑往更通俗的地方压,

    “堆到某个临界点之后,你的收益增速会垮,但成本会疯涨。到那时候,别的大厂为了训练一个更好的模型直接烧掉几千万甚至一亿美金,你哪怕卖肾也跟不起。真正的破局,不在更大,在更聪明地用更少。”

    “具体怎么做?”

    任少卿的语气已经完全变了。

    “让模型只用它需要用的那部分脑子去思考,别把整个网络都喊起来处理一个简单问题。”

    顾屿把手从大裤衩的口袋里抽出来,随手在空中画了个圈,用极具画面感的网梗语气说道:

    “打个比方,你现在开了一家号称能做全宇宙所有菜的饭店。但你现在的架构逻辑是,哪怕顾客只进来点一盘最普通的醋溜土豆丝,你也会把后厨几万个米其林顶级主厨全叫醒,让他们排着长队来切土豆。这叫什么?这叫大炮轰蚊子,纯纯的‘傻大款’式的大力出奇迹,非常浪费。”

    任少卿微微一愣,这个大白话比喻糙是糙了点,却像一把锋利的手术刀,一刀精准地剖开了他模型里最大的那个病灶。

    顾屿看着他:

    “而我想让你做的真正神级架构,是懂得分工的‘混合专家机制’。系统接到点单,自动评估难度。是土豆丝,就只唤醒底层的小神经元去当切菜工;是满汉全席,才全面激活庞大的主网络。用最小的算力功耗,跑出最极限的效率。”

    “同时,让它学会自己推理,而不只是学会背答案。让它像有常识的人类一样自己去验证、纠错,而不是靠你每天拿海量的人工标注喂它吃现成的结果。”

    走廊里沉默了将近十秒。

    任少卿站在原地,眼睛里有什么东西在动。

    他不是在反驳。

    他是在消化。

    这是个经过长期训练的研究员的习惯。

    先装进去,再开口。

    “你是学AI的?”

    他最终开口,语气里已经没了最初那层礼貌性的疏远。

    “不是。”

    顾屿站起来,拍了拍裤腿上沾的灰,

    “高中生。”

    任少卿的表情出现了一个短暂的空白。

    “……高中生。”

    “刚毕业,”

    顾屿补了一句,

    “今年九月去清华报到。”

    任少卿看着他,脸上写满了困惑。

    顾屿也没打算给他太多时间整理思路。

    他从裤兜里掏出一张名片,递过去。

    名片正面只有一个手机号,简洁到近乎草率。

    “如果有兴趣,打这个电话。”

    顾屿说,

    “接电话的是我们的CEO,算力、薪资、课题方向,你要什么先开口。她会给你想要的东西。”

    任少卿接过名片,低头看了一眼。

    背面,印着四个字。

    回响科技。

    他抬起头,再次打量面前这个穿着大裤衩和白T恤、顶着一头张扬黄毛、站在西安交大走廊夕阳里的少年。

    “等等,”

    他声音有点干,

    “你是……回响科技的......”

    “董事长。”

    顾屿纠正了一个字,转身往走廊出口走,语气懒散,

    “回响科技,欢迎你的加入。”

    走廊尽头,夕阳把他的影子拉得很长。

    任少卿站在原地,手里捏着那张名片,久久没动。
上一页 回目录 下一章 存书签