第703章 徐阳给陈澈带来的惊喜(1 / 1)
在杭城,陈澈布局了MCN公司、直播电商产业、线上电商。
但这些都是表面上的,在NSC方面,他对杭城的未来也是寄予厚望。
比如云计算、人工智能等,都是未来陈澈落地杭城的企业。
京津冀、江浙沪、大湾区,这三个地方陈澈要放的东西都不一样,起码在他的主张规划里,是要大方向区分开的。
如今既然聊起来了,陈澈也是趁机试探一番的心思,拿起茶杯看向徐阳道:
“姐夫,在杭城这地界,你们技术圈子里AI这波浪潮动静大不大?
徐阳谢过倒茶的服务员,把茶杯往旁边放了放,沉吟了一阵笑道:
“算是热火朝天吧,余杭那边未来科技城天天都有新公司冒出来,大数据、智能推荐的概念满天飞,我们组里最近也在讨论怎么用AI优化后台的一些流程,比如日志分析、异常检测这方面,不过感觉现在很多还是在应用层打转,真正底层创新的,感觉不多。”
陈澈闻言眼前一亮,看样子是他低估了徐阳的水平了,放下茶杯道:
“应用层当然重要,但我觉得未来真正能拉开差距的,还是在更基础、更“聪明”的AI上,姐夫,你对大模型这块有研究吗?就是那种...能理解语言、能生成内容、能做复杂推理的模型。”
“大模型?”
徐阳思索片刻问道:
“你是说类似Google的BERT那种?或者OpenAI的GPT?”
陈澈点点头。
OpenAI已经在上半年推出了1,为此他还专门让伊芙琳进行了渗透。
徐阳继续思索着道:
“嗯,关注过,这东西现在很火,算是NLP领域的新突破吧,核心是Transformer架构,靠海量数据和巨大算力堆出来的,BERT主要擅长理解语义,GPT更偏向生成文本...不过国内真正敢大规模投入做这个的好像还不多,主要是成本太高了,训练一次烧钱烧得厉害,对数据、算力、算法人才要求都极高。”
陈澈深深皱起眉,随即身体微微前倾,语气带着憧憬笑了笑道:
“对,就是这个方向,姐夫你说到点子上了,成本高门槛高,恰恰意味着机会啊,我最近在鹏城、香江和杭城打听,就是想看看有没有团队在深耕这个领域。”
徐阳闻言暗想自己猜对了,只是他想到深处表情凝重了些。
陈澈没等他说话,便主动碰了碰他的胳膊在其看来之际,珉着笑继续道:
“姐夫,你别看它现在烧钱,等模型真正练成了,它的通用能力、泛化能力,是那些专用小模型没法比的。
徐阳点点头,算是认可。
陈澈抓起茶杯,略显激动道:
“姐夫你想象一下,未来它能写代码、做翻译、分析报告、甚至进行复杂的对话和推理...应用空间太大了,我甚至有个梦想,想着未来能支持做出一个像DeepSeek这样名字的、具有深度探索和理解能力的大模型平台。”
面对徐阳这样的人,陈澈稍微带了一点热血中二,提出了“梦想”的字眼。
“Deep…Seek?”
果然,徐阳被陈澈的热情和“DeepSeek”这个名字触动,饶有兴致。
只是如今在他嘴里,Deep…Seek这是两个单词,组在一起就是深度探索。
正好陈澈提到了,他想做具有深度探索和理解能力的大模型平台。
“DeepSeek,这名字有意思。”
徐阳顿了顿,笑着回应道:
“新新,你这么说我现在十分理解你的兴奋点,大模型的潜力确实诱人,就像给AI装了个更接近人类理解力的大脑,不过这其中挑战也摆在眼前,还不小呢。”
…
“不是哥们。”
郭景林握着酒瓶回来,发现他们两个人还在聊这些,都有点无语了。
他无语的不是两人还在聊。
他是无语两人在聊这些。
重新坐在自己的位置上,郭景林碰了碰陈澈的胳膊,对着徐阳道:
“姐夫,吃饭啊。”
徐阳闻言看过去,他甚至都不知道郭景林离开过,点点头看向周围。
服务员刚好端着开胃汤过来,依次放到了几人面前,很快在场所有人都有了。
餐桌前众人已经开始吃了起来,餐具碰撞的声音不绝于耳。
徐阳拿起小碗里的汤勺,轻拨了一下汤面从三块排骨里首先挖了一勺汤。
郭景林拿起白色的公筷,伸向缓缓转动的餐盘里,夹了一些到餐盘上道:
“快吃吧,等会儿好好喝几杯。”
陈澈喝着汤没搭理郭景林,而是重新看向徐阳,继续刚才的话题道:
“姐夫觉得这中间的挑战是什么?”
徐阳闻言,立马放下汤勺,把鲜美的汤汁咽进嘴里,笑了笑说道:
“我只是拙见,并不权威啊。”
陈澈道:
“没事姐夫,咱们就是聊聊嘛,我现在是真有这方面需求,姐夫可别藏私。”
徐阳连忙道:
“肯定不藏私,就是一点认识。”
陈澈洗耳恭听道:
“姐夫你说。”
徐阳当下摊开手掌,说道:
“我是觉得第一是算力,训练需要大量GPU集群,持续投入巨大,杭城那边虽然有阿里云,但自建或租赁的成本都是天文数字,真要自己做成本是大问题,第二是数据上的,想要搞那种大模型平台需要高质量、海量、多样化的数据,特别是中文数据,数据的清洗、标注、合规性都是大问题,算法上Transformer是基础,但如何优化架构、提升训练效率、降低推理成本?如何解决模型幻觉偏见和安全问题?这些都需要顶尖的算法团队,最后也是最重要的一点,无论成功与否还是要找到能赚钱的场景,是提供API服务?赋能特定行业?还是做成产品?现在大家都在摸索,不知要多久。”
期间,徐阳声情并茂。
他是一个老实人,平常话不多,只有涉及到他熟悉的专业才显得侃侃而谈。
陈澈认真听着,不时点头道:
“姐夫分析得很透彻啊,其实最大的痛点就是投资的价值所在嘛,算力问题,随着芯片发展和云服务成熟,成本曲线肯定是下降的,数据需要长期积累和有策略地获取,说到底,算法和人才,这正是我投资最看重的——有没有核心的、能攻坚的团队。
徐阳点点头。
陈澈在这时笑了笑又道:
“至于落地...我相信,当模型足够强大时应用场景会自己涌现出来,甚至创造出我们现在想不到的需求,关键在于先把这个“大脑”练好、练强,杭城有阿里达摩院这样的机构在引领,还有浙大等高校的人才基础,大环境方面我觉得土壤是有的。”
徐阳点头道:
“嗯,达摩院确实在NLP和视觉方面很强,他们肯定也在布局大模型,高校实验室也有一些前沿研究,不过从实验室成果到产业化、工程化落地,中间还有很长的路要走,需要巨大的资金支持和商业化的魄力。”
说到这里,徐阳看向陈澈,其实心里已经有了猜想,最后迟疑又问道:
“所以你是想找那些已经有一定技术积累,敢于挑战这个大方向的初创团队?”
陈澈喝了一口汤道:
“没错,最好是那种如今有清晰技术路线图,核心团队背景过硬,比如有GoogleBrain,FAIR,或者国内顶尖实验室经验的,并且对模型的理解超越简单应用的团队,他们可能现在还在早期,模型规模不大,但方向明确,有潜力,姐夫你在杭城圈子里有没有听说过这样的苗子?”
陈澈早就去寻找这样的团队了,只是他上一世不知道那些成功的团队如今在干嘛,只知道未来杭城的环境很不错。
这方面,唐智贤已经在准备了,只是时至今日都没有给陈澈准确答复。
如今他面对徐阳,当然没有提NSC已经开始准备,只是当做一次闲聊的探底,如果有机会,他自然想对方帮自己。
至于让徐阳帮忙找人,陈澈对此没有抱太大希望,他之所以还要这么说,主要是把关系拉近,毕竟这不是纯商业饭局。
另外,就是陈澈碰运气,以及想看看徐阳对这件事的态度和上心程度。
截止目前聊的这些,其实陈澈已经非常惊喜了,他还真不知道对方对此有所了解,或许以后真能成为他的助力呢。
徐阳确实不适合去乐旗文化和环客,要是真能在这方面帮他,是再好不过了。
场间,徐阳陷入沉思,他回忆着自己这方面认识的人,轻声道:
“我倒是知道几个从大厂出来、背景不错的工程师,但具体方向是不是纯大模型,我还得再打听打听,回头我问问,不过你要是真想搞,杭城倒是也真不错。”
陈澈正准备说话,郭景林却把酒杯递了过来,带着一丝催促和幽怨道:
“来来来,喝一杯。”
陈澈和徐阳抬头看去,原来是陈天宏和郭启东带头,大家一起干杯。
两人对视一眼,倒是暂停话题,陈澈更是十分轻松的和二人一一碰杯道:
“来,喝一个。”
徐阳不怎么喝酒,但还是喝了好大一口酒,喝完便示意陈澈二人先吃菜。
餐厅里闹哄哄的,因为这餐桌够大,基本上也是一小波人各聊各的。
郭景林喝了一杯,看向陈澈和徐阳时眼睛里带着幽怨,放下酒杯道:
“你们俩刚才在聊什么呢?”
陈澈摊手道:
“就是你听到的这些啊。”
郭景林追问道:
“你什么时候懂这些东西了?”
陈澈轻轻敲了敲桌面笑道:
“让你平常多学习,你不听,以后什么新兴产业都得了解啊你。”
正在这时徐阳笑出了声,在陈澈二人看过来之际,带着调侃道:
“新新这些东西,估计不是在学校里面学的吧,我跟新新聊天总有一种对方工作了好多年的错觉,这一点算是天赋吧。”
郭景林十分认可道:
“对,你小子就是天赋比我好。”
陈澈哈哈笑道:
“不止呢,我还比你努力。”
郭景林闻言故意脸黑道:
“我就知道你肯定背着我努力了!”