李沐与Alex Smola这两位大神“舍亚马逊,入大模型”,会做出哪些新的动作呢?
横空出世的ChatGPT在火爆出圈之后,硅谷巨头、各大互联网大厂可谓是上演了一场群雄逐“ChatGPT”……在AIGC新风口之下,人才无疑成为这场“硬仗”的主力军。
2023年2月,亚马逊机器学习部门原杰出科学家、“参数服务器之父”的Alex Smola离职,随后公布了新的创业项目——Boson.ai,担任首席执行官兼联合创始人。随后,又有消息爆出,亚马逊首席科学家李沐已从亚马逊离职,投身大模型方向创业。据爆料目前两人合伙成立的新公司Boson.ai,公开资料不多,网站显示还在建设中,但其目标已经明确:在搞通用大模型。虽然李沐并没有官宣加入的消息,网友们只能凭借新公司的GitHub项目中找到一些信息,但在Boson.ai的GitHub的项目主页中,已经能看见李沐的身影。
提到李沐,大家一定会先联想到的是:MXNet深度学习框架的主要贡献者之一、深度学习“大神”。
初入亚马逊时,人工智能部门才刚刚成立,对深度学习框架需求很强烈。那时,李沐就已经明白需要通过框架来更好地服务用户的道理。2016年11月,MXNet被亚马逊选为官方开源平台。它的速度、接口灵活性、节省内存,和分布式效率等特点成为可圈可点的优势,获得大家的一众好评,而MXNet的“获胜”也成为李沐职业生涯中精彩的一笔。
其实回头来看,不止于MXNet的成绩,李沐的每一份经历都是耀眼的存在:
2007年,还在上学的李沐就已经开始在微软亚洲研究院实习;
2008年,李沐从上海交通大学计算机系(计算机系ACM班)毕业;
2009年-2010年,李沐担任香港科技大学研究助理;
2011年4月-2012年8月,李沐又在百度担任高级研究员,创建了一套分布式机器学习广告系统;
2011年,收到美国卡内基梅隆大学(CMU)的offer;
2012年-2017年,赴美深造,攻读博士学位。
其实,在李沐担任百度高级研究员时,就已经拥有外人看来“光鲜亮丽”的工作。但他仍表示:“在百度的经历让我学到了很多,也更清楚地发现了自己的短板。但是当时国内做系统方向的人比较少,所以我还是选择了去美国继续攻读博士。”
他也曾收到来自谷歌的橄榄枝,但由于考虑MXNet的后续发展,依旧坚定的选择了亚马逊。
与“参数服务器之父”Alex Smola结缘
或许人生从来没有白走的路,每一步,都算了数。
在百度工作期间,李沐通过利用广告数据训练能够预测用户点击广告率的模型,从中积累了不少工业界经验,为他之后开发机器学习系统的长久事业奠定了好的基础。
而在CMU的经历,让李沐结识了两位导师:机器学习大师Alex Smola和分布式系统教授Dave Andersen,在他们的辅助之下得到更好的成长,就此开启了一段对他今后人生都影响颇深的博士生涯。
导师之一的Alex Smola,除了曾是美国卡内基梅隆大学(CMU)的教授,李沐的博士导师,他还是国际机器学习的知名科学家,机器学习畅销著作《动手学深度学习》的主要作者。
并且,Alex Smola在分布式深度学习框架领域具有极高地位,曾提出并行LDA(Latent Dirichlet Allocation)的框架,这也是参数服务器概念的最早来源。
他的过往经历,能用“开挂”来形容:
1996年,在慕尼黑工业大学获得硕士学位;
1998年,获得柏林工业大学的计算机科学博士学位;
2004年,在NICTA的统计机器学习项目中担任高级首席研究员和项目负责人;
2008年,入职雅虎研究院;
2012年春-2014年底,在谷歌研究院工作;
2013年起,他开始担任CMU的教授;
年,创立了马里亚纳群岛实验室。
2016年7月,Alex Smola重返工业界,选择加入亚马逊云科技,致力于构建AI和机器学习工具。随后,李沐带着MXNet以兼实习的身份加入亚马逊。
2017年,李沐博士毕业后正式加入亚马逊,和团队继续做MXNet的开发和深度学习的应用,并直接向Alex Smola汇报工作。
如今,这两位大神的“舍亚马逊,入大模型”,不少前排吃瓜网友纷纷表示:“人家又开辟了新的道路啊!”还有网友调侃道:“看来AI真是创业致富新思路了。”