❌

普通视图

发现新文章，点击刷新页面。

昨天以前Brian (Bojie) Li

《看天下》报道：李博杰：放弃三百万年薪，去做九死一生的事

Brian (Bojie) Li

作者 Bojie Li

2024年5月10日 12:00

按：《看天下》是国内发行量最大的新闻杂志之一，每期发行量逾百万。这也是个人专题报道第一次登上主流纸媒。采访是 2024 年 4 月进行的，我是 5 月 10 日从朋友处才得知我上了杂志，稿子我都没有看过，发现编辑还从各种渠道搜集到了一些个人信息。感觉我终于能把自己做的东西给非技术人讲明白了，在短短的采访中，记者完全听懂了我在做的东西，写出来的稿子比我自己写的都好。我老婆说我提供的生活照胡子都没有刮干净，就不能找一张干净点的吗？

2024.05.08 总第 627 期

给外星人发信号，不想被生活锤扁——李博杰：放弃三百万年薪，去做九死一生的事

这个世界并不缺有理想的人，缺的是那些有魄力去追求理想的人。

撰文王亚坤

事业心很强的男生适不适合做人生伴侣？

Brian (Bojie) Li

作者 Bojie Li

2024年5月5日 20:30

（本文是我的知乎回答《事业心很强的男生适不适合做人生伴侣？》）

开始创业之后，认识很多创业者，大多数都是事业心很强的男生。

发现一个有趣的现象：这些创业者单身率明显比同龄人高。而且婚姻的稳定程度也比同龄人低。

单身率高

在 AI、移动互联网和 Web3 领域，创业成功的联合创始人，基本上身价至少一个小目标；创业没成功的联合创始人，基本上也有非常光鲜亮丽的履历，比如名校毕业，大厂高职级，各种头衔和奖项。他们/她们肯定是不愁找到很好的伴侣的。但为什么单身率这么高，婚姻稳定度这么低呢？

核心原因就是事业心很强的男生大多数时间和兴趣都在事业上，对生活、感情和家庭的投入比较少。

知乎《新人物》访谈：华为天才少年的 AGI 信仰

Brian (Bojie) Li

作者 Bojie Li

2024年4月22日 17:30

一个月前知乎《新人物》的访谈视频终于发布了。我还是第一次参加此类带生活内容的访谈，这绝对不是公司的 PR，因为全程都没有出现我们公司的名字和产品，甚至很少有人知道我们公司真实的名字。

感觉知乎还是挺有做媒体的操守的，采访之后没有让我看视频，就直接发布了，所有剪辑、标题和旁白都是知乎小编做的。

（04:16，215 MB）

视频拍摄地：

北京办公室
家里（访谈，跟老婆一起做饭，还有一些照片）
树村郊野公园（我经常跑步的地方，那个会飞的电动蝴蝶是我 2017 年做的，拍摄过程中被挂到了树上，还是我们非常强悍的摄影师小哥哥爬到树上给摘下来的）

如何培养 Research Taste？

Brian (Bojie) Li

作者 Bojie Li

2024年4月15日 16:30

（本文首发于知乎回答：《如何培养在计算机系统领域的研究品味（Research Taste）?》）

转眼间从科大本科毕业已经接近 10 年了。昨天跟老婆讨论我们科大系统圈子同学近期的发展，就发现 research taste 是决定学术成果最关键的因素。第二关键的因素则是动手能力。

什么是 research taste？我认为，research taste 就是找到未来有影响力的研究方向和研究课题。

很多同学技术很强，也就是动手能力很强，系统实现能力很强，但是仍然做不出来有影响力的研究成果，主要原因就是 research taste 比较差，选的研究方向要么只是蹭热点，缺少自己的思考；要么过于小众，没有人关注。

博士生的 research taste 靠导师

我认为，research taste 早期主要靠导师培养，后续主要靠自己的愿景。

Chatbot Arena：基于社区评价的大模型评测基准

Brian (Bojie) Li

作者 Bojie Li

2024年4月14日 02:30

（本文首发于知乎回答：《目前大语言模型的评测基准有哪些？》）

必须吹一波我们 co-founder @SIY.Z 的 Chatbot Arena 呀！

Chatbot Arena 是基于社区评价的大模型评测基准。上线一年来，Chatbot Arena 已经有超过 65 万次有效用户投票。

Chatbot Arena 见证大模型的快速进化

最近的一个月，我们在 Chatbot Arena 上见证了几件非常有趣的事情：

Anthropic 的 Claude-3 发布，大杯 Opus 模型的性能超越了 GPT-4-Turbo，中杯 Sonnet 和小杯 Haiku 模型的性能也追平了 GPT-4。这是 OpenAI 以外的公司首次夺得排行榜的首位。Anthropic 的估值已经 $20B，直逼 OpenAI 的 $80B 了，OpenAI 是应该有点危机感了。
Cohere 发布了迄今最强的开源模型 Command R+，104B 模型的性能追平 GPT-4，当然跟 GPT-4-Turbo 还有一定差距。我今年年初接受甲子光年采访的时候提出了 2024 年大模型四大趋势（《AI 一天，人间一年：我与 AI 的 2023｜甲子光年》）：“多模态大模型能够实时理解视频，实时生成包含复杂语义的视频；开源大模型达到 GPT-4 水平；GPT-3.5 水平开源模型的推理成本降到 GPT-3.5 API 的百分之一，让应用在集成大模型的时候不用担心成本问题；高端手机支持本地大模型和自动 App 操控，每个人的生活都离不开大模型。” 第一个是 Sora，第二个是 Command R+，都已经应验。我还是重复这个观点，如果一家主要做基础模型的公司 2024 年还训练不出 GPT-4 的话，就不用再折腾了，浪费了大量算力，最后连开源模型都比不上。
通义千问发布了 32B 开源模型，几乎可以达到 top 10，不管中文英文都很能打。32B 模型在成本上的杀伤力还是很强的。
OpenAI 被 Anthropic 的 Claude Opus 超过了，自然也不示弱，马上发布了 GPT-4-Turbo-2024-04-09，又夺回了排行榜上第一的宝座。不过 OpenAI 迟迟没有发布 GPT-4.5 或者 GPT-5，而且大家期待的多模态模型一直没有出来，这是有点令人失望的。

B 站 Up 主采访李博杰：为什么创业

Brian (Bojie) Li

作者 Bojie Li

2024年4月7日 13:30

本视频是 B 站 Up 主 “苹果冒个泡儿” 对我的采访视频，

四万字长文：AI Agent 应该更有趣还是更有用？

Brian (Bojie) Li

作者 Bojie Li

2024年3月29日 20:30

（全文约 4 万字，主要内容来自 2023 年 12 月 21 日在中科大校友会 AI 沙龙上的 2 小时报告，也是 2024 年 1 月 6 日知乎 AI 先行者沙龙 15 分钟报告内容的技术扩展版本，文章经笔者整理和扩展）

非常荣幸来到科大校友会 AI 沙龙分享一些我对 AI Agent 的思考。我是 1000（2010 级理科实验班）的李博杰，2014-2019 年在中科大和微软亚洲研究院读联合培养博士，2019-2023 年是华为首届天才少年，如今我跟一批科大校友一起在做 AI Agent 领域的创业。

今天是汤晓鸥教授的头七，因此我特别把今天的 PPT 调成了黑色背景，这也是我第一次用黑色背景的 PPT 做报告。我也希望随着 AI 技术的发展，未来每个人都可以有自己的数字分身，实现灵魂在数字世界中的永生，在这个世界里生命不再有限，也就不再有分离的悲伤。

AI：有趣和有用

AI 的发展目前一直有两个方向，一个是有趣的 AI，也就是更像人的 AI，另外一个方向就是更有用的 AI，也就是更像工具的 AI。

AI 应该更像人还是更像工具呢？其实是有很多争议的。比如说 OpenAI 的 CEO Sam Altman 就说，AI 应该是一个工具，它不应该是一个生命。而很多科幻电影里的 AI 其实更像人，比如说 Her 里面的 Samantha，还有《流浪地球 2》里面的图丫丫，黑镜里面的 Ash，所以我们希望能把这些科幻中的场景带到现实。只有少数科幻电影里面的 AI 是工具向的，比如《钢铁侠》里面的贾维斯。

除了有趣和有用这个水平方向的之外，还有另外一个上下的维度，就是快思考和慢思考。这是一个神经科学的概念，出自一本书《思考，快与慢》，它里面就说人的思考可以分为快思考和慢思考。

所谓的快思考就是不需要过脑子的基础视觉、听觉等感知能力和说话等表达能力，像 ChatGPT、stable diffusion 这种一问一答、解决特定问题的 AI 可以认为是一种工具向的快思考，你不问它问题的时候，它不会主动去找你。而 Character AI、Inflection Pi 和 Talkie（星野）这些 AI Agent 产品都是模拟一个人或者动漫游戏角色的对话，但这些对话不涉及复杂任务的解决，也没有长期记忆，因此只能用来闲聊，没法像 Her 里面的 Samantha 那样帮忙解决生活和工作中的问题。

而慢思考就是有状态的复杂思考，也就是说如何去规划和解决一个复杂的问题，先做什么、后做什么。比如 MetaGPT 写代码是模拟一个软件开发团队的分工合作，AutoGPT 是把一个复杂任务拆分成很多个阶段来一步步完成，虽然这些系统在实用中还有很多问题，但已经是一个具备慢思考能力的雏形了。

遗憾的是，现有产品中几乎没有在第一象限，兼具慢思考和类人属性的 AI Agent。斯坦福 AI 小镇是个不错的学术界尝试，但斯坦福 AI 小镇里面没有真人的交互，而且 AI Agent 一天的作息时间表都是事先排好的，因此并不是很有趣。

有趣的是，科幻电影里面的 AI 其实大部分是在这个第一象限。因此这就是目前 AI Agent 和人类梦想之间的差距。因此我们在做的事情跟 Sam Altman 说的正好相反，我们希望让 AI 更像人，同时又具备慢思考的能力，最终演进成一个数字生命。

国科大实践课题：只会基本编程的本科生也能开发 AI Agent

Brian (Bojie) Li

作者 Bojie Li

2024年2月25日 23:40

从 2023 年 12 月开始，我作为企业导师，跟国科大刘俊明教授合作了一个 AI Agent 实践课题，有大约 80 名来自全国各地的学生参加，大部分是只会基本编程的本科生，也有一部分有 AI 基础的博士生和硕士生。

2023 年 12 月和 2024 年 1 月开了 6 次组会，讲解了 AI Agent 的基础知识、OpenAI API 的用法、本次 AI Agent 实践课题，并解答同学们在实践过程中遇到的问题。实践课题包括：

企业 ERP 助手
狼人杀
智能数据采集
手机语音助手
会议助手
老友重逢
谁是卧底

2 月 20-24 日，参与这个研究课题的部分同学集中在北京进行 Hackathon，并展示了项目的阶段成果。参与的同学普遍感受到大模型能力的强大，没想到这么复杂的功能仅用几百行代码就做出来了。以下是部分展示的项目成果：

Groq 推理芯片：用空间换时间的把戏

Brian (Bojie) Li

作者 Bojie Li

2024年2月22日 22:00

最近 Groq 推理芯片以 500 token/s 的大模型输出速度刷屏了。

一句话来说，这个芯片就是玩了个用空间换时间的把戏，把模型权重和中间数据都放在了 SRAM 里面，而不是 HBM 或者 DRAM。

这是我 8 年前在微软亚洲研究院（MSRA）就做过的事情，适用于当时的神经网络，但真的不适合现在的大模型。因为基于 Transformer 的大模型需要很多内存用来存储 KV Cache。

Groq 芯片虽然输出速度非常快，但由于内存大小有限，batch size 就没法很大，要是算起 $/token 的性价比来，未必有竞争力。

Groq 需要几百卡的集群才能跑 LLaMA-2 70B 模型

我是如何走上 AI 创业之路的

Brian (Bojie) Li

作者 Bojie Li

2024年2月20日 00:00

我与 AI 的早期接触

读博期间与 AI 的邂逅

我博士本来是做网络和系统研究的，博士论文就是《基于可编程网卡的高性能数据中心系统》。很多做网络和系统的人看不起一些 AI 研究，说 AI 的文章容易灌水，只要有 idea，一两个月就可以发出 paper 来。而网络和系统的顶会文章往往需要很大的工作量，做一年之久。

除了在学校的时候上过的那些 AI 的课，我第一次正经做 AI 相关的项目是 2016 年，用 FPGA 加速 Bing Ranking 里面的神经网络。当时正好是 AI 的上一波热潮，今天的 AI 四小龙都是那段时间启动的。

微软把 FPGA 大规模部署到数据中心，除了网络虚拟化，还有很重要的一块就是神经网络推理加速。当时我们还用流水线并行来把神经网络的权重全部放到 FPGA 片上的 SRAM 里面，从而实现超线性的加速比。这段故事在《MSRA 读博五年——自己主导的第一篇 SOSP》中 “机器学习加速器的探索” 一节有更详细的描述。

当时搞网络和系统的很多人对 AI 并不了解，也不屑于了解，连训练和推理都分不清，也搞不清正向和反向算子。通过优化这些算子，我至少知道了基本的前馈神经网络（FFNN）到底是怎么算的。但我并没有接触业务，没有折腾过自己的模型。

OpenAI Sora：视频生成模型是世界模拟器

Brian (Bojie) Li

作者 Bojie Li

2024年2月16日 22:00

投资人圈子里今天流传一个段子：今天终于可以睡个好觉了，因为再也不用担心哪天我投资的那些视频生成公司被别人超过了。

上个月接受甲子光年采访《AI 一天，人间一年：我与 AI 的 2023｜甲子光年》的时候，我预测了 2024 年的四大趋势，第一条就是视频生成，没想到这么快就成真了。（当然，目前 Sora 生成的视频包含的语义还并不复杂，而且也做不到实时生成，所以大家还有机会）

多模态大模型能够实时理解视频，实时生成包含复杂语义的视频；
开源大模型达到GPT-4 水平；
GPT-3.5 水平开源模型的推理成本降到 GPT-3.5 API 的百分之一，让应用在集成大模型的时候不用担心成本问题；
高端手机支持本地大模型和自动 App 操控，每个人的生活都离不开大模型。

视频生成模型是世界模拟器

OpenAI 的技术报告标题也很有深意：视频生成模型是世界模拟器。(Video generation models as world simulators)

技术报告的最后一句话我觉得写得也很好：我们相信，Sora 如今所展现出的能力表明，持续扩展视频模型是一条通往强大模拟器的希望之路，可以模拟物理世界、数字世界以及生活在这些世界中的对象、动物和人。

其实 OpenAI 早在 2016 年，就明确提出生成模型是让计算机理解世界最有潜力的方向。还专门引用了物理学家费曼的一句话：What I cannot create, I do not understand. （我不能创作出来的，我就没有理解）

Peter Thiel 的 Zero to One 读书笔记

Brian (Bojie) Li

作者 Bojie Li

2024年2月14日 19:00

导师推荐我读 Peter Thiel 的 Zero to One，真的是创业必读。Peter Thiel 是硅谷的天使，投资界的思想家，PayPal 黑帮创始人。

所以《黑天鹅》的作者对这本书的评价是，当一个有冒险精神的人写书了，务必要读一读。如果作者是 Peter Thiel，就要读两遍。但是保险起见，请读三遍，因为《Zero to One》绝对是经典之作。

读完这本书最大的感受是，创业和做研究在很多方面上几乎是一样的。

所有赚钱的公司都是垄断公司

书中最有趣的观点就是，所有成功的企业都是不同的，或者说所有赚钱的公司都是垄断公司。

书中讨论的垄断公司并不是借助政府资源实现垄断，而是通过创新，使它供给消费者的产品其他企业无法供给。

如果一个行业里存在多家完全竞争的公司，不管创造多少价值，公司的盈利都不会太多。例如美国航空业每年创造数千亿美元的价值，但每次飞行航空公司只能从每位乘客身上赚到 37 美分。Google 每年创造的价值不如航空业多，但利润是 21%，利润率是航空业的 100 多倍。

垄断者为了自我保护会撒谎，通过把自己的市场定位成多个大市场的并集来虚构并不存在的竞争。例如 Google 没有把自己定位成一家搜索引擎公司，而是定位成一家广告公司或者多元科技公司，后两者的市场更大，Google 只是整个市场中不起眼的小卒。

而非垄断者为了夸大自己的独特性，往往把自己的市场定义成各种更小市场的交集。例如 Palo Alto 的英式餐厅，或者唯一一家开发电子邮件支付系统的公司（PayPal）。

但把市场描述得太狭小是一种致命的诱惑，表面上看起来能够理所当然地驾驭它，但这样的市场可能根本不存在，或者太小了，支撑不起一家公司来。

AI 一天，人间一年：我与 AI 的 2023｜甲子光年

Brian (Bojie) Li

作者 Bojie Li

2024年2月7日 18:00

（本文转载自甲子光年公众号，感谢甲子光年的采访）

总结 2023，启程 2024。

作者｜刘杨楠苏霍伊赵健

最近一两周，很多公司都在紧锣密鼓地开战略会，明确 2024 年的目标与规划。

经过一年多 AI 狂飙带来的推背感，是时候给忙碌的 2023 年做一个年终总结了。开完战略会、进入春节假期，大部分公司才会真正停下步履不停的脚步，进入短暂而难得的休息状态。

那么，如何总结 2023 年呢？

「甲子光年」邀请了基础大模型、AI Infra（AI 基础设施）、多模态、行业垂直场景与学术研究等领域的 30 多位 AI 从业者，分别抛出了 5 个问题：

2023 年你的关键词是什么？
2023 年你所经历的 Magic Moment（印象最深刻的一个瞬间）是什么时候？
2023 年你是否在一轮又一轮的技术冲击中彷徨过？从彷徨到豁然开朗，中间的转折点是什么？
预测一下 2024 年 AI 行业可能发生的重要事件？
如果对一年前的自己说一句话，你会说什么？如果向一年后的自己问一个问题，你会问什么？

他们的彷徨与焦虑、激动与兴奋，是 AI 行业一整年的缩影；他们的探索与坚持、刷新与迭代，将是未来五年甚至十年 AI 大爆炸的前奏。

以下是他们的分享（按姓名首字母排序）。

我们在韩国艺匠的婚纱照

Brian (Bojie) Li

作者 Bojie Li

2024年2月3日 22:00

早在 2021 年就预订了韩国艺匠的婚纱照，想去科大拍婚纱照，但是疫情之后科大就一直不让校外人员进校了。好在韩国艺匠是全国连锁的，2023 年 8 月我们就改到北京拍了，没有加钱，北京的拍摄环境还比合肥更好。

精修照片电子相册（131 张）

视频电子相册（03:54，150 MB）

生成式 AI 的下一站：更有趣还是更有用？

Brian (Bojie) Li

作者 Bojie Li

2024年2月3日 21:00

（本文是 2024 年 1 月 6 日笔者在知乎首届 AI 先行者沙龙上的演讲实录）

非常荣幸能够认识大家，非常荣幸能够来知乎 AI 的先行者沙龙来做分享，我是李博杰，Logenic AI 联合创始人。我们知道目前 AI Agent 非常火，比如说参加路演 70 多个项目，一半多都是跟 AI Agents 相关的项目， AI Agents 的未来会是什么样子呢？它未来应该是更有趣还是更有用呢？

我们知道 AI 的发展目前一直有两个方向，一个是有趣的 AI，一个是更像人的 AI，另外一个方向就是更有用的 AI，也就是 AI 应该更像人还是更像工具呢？其实是有很多争议的。比如说 OpenAI 的 CEO Sam Altman 他就说 AI 应该是一个工具，它不应该是一个生命，但是我们现在所做的事正好相反，我们现在是让 AI 其实更像人，其实很多科幻电影里的 AI 其实更像人，比如说 Her 里面的 Samantha，还有《流浪地球 2》里面的图丫丫，黑镜里面的 Ash，所以我们希望能把这些科幻中的场景带到现实。

除了有趣和有用这两个方向之外，还有另外一个上下的维度，就是快思考和慢思考，有一本书叫《思考，快与慢》，它里面就说人的思考可以分为快思考和慢思考，也就是所谓的快思考就是人下意识的想，不需要过脑子的，像 ChatGPT 这种一问一答的可以认为是一种快思考，因为你不问它问题的时候，它不会主动去找你，而慢思考呢，就是有状态的这种复杂的思考，也就是说如何去规划和解决一个复杂的问题，做什么、后做什么。

我的 2023 美国之行

Brian (Bojie) Li

作者 Bojie Li

2024年1月27日 23:00

（视频包含 96 张照片，06:24，190 MB）

Brian (Bojie) Li
投身 AI 的年轻人：华为天才放弃百万年薪，00 后休学创业，不惧失败最怕赚不到钱
2024年1月8日 19:15

投身 AI 的年轻人：华为天才放弃百万年薪，00 后休学创业，不惧失败最怕赚不到钱

Brian (Bojie) Li

作者 Bojie Li

2024年1月8日 19:15

（转载自搜狐科技，作者：梁昌均）

编者按：

人生重燃，如春柳抽芽，历经寒冬的磨砺，终焕生机。

每个人都是航行者，在人生的旅途中，我们难免遭遇困境、挫折和失败。面对风浪的洗礼，我们不断调整航向，坚定前行，寻找属于自己的彼岸。

人生重燃，亦是对自我价值的重新认识。我们要学会欣赏自己的优点，如琴瑟之和谐，亦接受自己的不足，如同璞玉需经琢磨方显光华。

此路虽不易，但如清泉之在石，日积月累，终汇聚成海。

值此跨年之际，搜狐财经、搜狐科技联合推出策划报道，聚焦个体小人物的人生重燃之旅，一起勇敢面对人生挑战。

连续暴击，一起调戏天才少年？12月21日北京AI沙龙

Brian (Bojie) Li

作者 Bojie Li

2023年12月22日 00:00

（转载自科大新创校友基金会）

12 月 21 日，中国科大北京校友 AI 沙龙在中国科学院网络信息中心进行，曾经的华为“天才少年”、Logenic AI 联合创始人李博杰 (1000)做《AI Agent 的下一站:有趣还是有用?》主题报告，与线上、线下累计近 200 位同学、校友分享。

主题报告

报告围绕《AI Agent：有用还是有趣》主题展开，结合具体的生活、工作场景，在 “有趣” 角度，分析了如何低成本地实现 AI agent 的长期记忆以及如何建模人的内部思考过程等问题；在 “有用” 角度，对于如何实现 AI agent 的图片理解、复杂任务规划与分解和如何减少幻觉等问题展开讨论。此外，他还对于如何降低大模型的推理成本提出了自己的看法。

AI Agent & 大模型经典论文推荐

Brian (Bojie) Li

作者 Bojie Li

2023年12月23日 14:28

经常有人让我推荐一些 AI Agent 和大模型相关的经典论文，在这里列一些对我比较有启发的 paper，可以作为 Reading List。

这里面大部分的 paper 都是今年刚发表的，但是也有一些文本大模型、图片视频生成模型的经典论文，把这些经典论文读明白是理解大模型的关键。

这些论文如果都读完了，哪怕是只领会了论文的核心 idea，也保证能让你不再仅仅是一名 prompt 工程师，而能够跟大模型的专业研究者深入讨论了。