新开传奇私服

传奇私服发布网

当前位置:首页 > 互联网 IT业界 > 大厂要面子,Kimi要里子

大厂要面子,Kimi要里子

admin 互联网 IT业界 50热度

  文听筒 Tech,作者|饶言‍‍‍‍,编辑  才哥

  当互联网大厂还醉心于在 AI 的“百模大战”中大显身手时,谁也没有料到,他们竟然被一个“新人”抄了后路。

  Kimi 的爆火,来得太过突然,也很意外。

  Kimi 有多火?火到宕机成了近期常见的事,以至于官方不得不出面道歉。

  说到 AIGC,必聊 Kimi,成了网友们最近的日常。很多人发现,自己的朋友圈和微信群几乎都在推荐 Kimi,“这几天微博热搜几乎每天都能刷到 Kimi”、“如果还没用过 Kimi,那你就 OUT 了”……

  “此前我一直用文心一言,直到有一天,朋友推荐了 Kimi,我才知道,什么是好用的国产大模型。”80 后李琳是文字工作者,她对大模型的需求主要集中在资料的检索和整理,之前文心一言能够基本满足她的需求。

  但 Kimi 给了李琳全新的体验,“仅从资料和素材的整理这一点来言,Kimi 体验感明显胜于文心一言。”

  王明是一位资深 AI 从业人员,他对此并不惊讶,他见证了 Kimi 从内测到爆火的过程,“很显然,‘草根出身’的 Kimi 更懂得什么是用户真正的需求。

  “Kimi 仍有一些不足之处,但从目前的用户体验来看,它已经走在一些大厂大模型的前面。”王明直言,在目前在国产大模型中,他更看好 Kimi 的未来。

  资本市场也对 Kimi 表现出了满腔热情。自 3 月中旬以来,A股市场便催生了 Kimi 概念股,不少公司的股价受此影响,接连大涨。

  万兴科技是接入 Kimi 的 AIGC 软件企业之一,旗下视频创意软件万兴喵影接入 Kimi。在万兴科技 AI 创新中心总经理齐镗泉看来,Kimi 的出圈不仅反映了公众对于新兴技术的兴趣和期待,也体现了资本市场对于 AI 技术的信心和追捧,“这也是个积极的信号,展示了 AI 应用的潜力和商业价值。”

  “Kimi 的出圈并非一蹴而就,其背后是大量的研发投入和持续的技术创新。”齐镗泉对《听筒 Tech》表示。

  不过,Kimi 未来能延续目前的火热吗?目前显然还无法判定。实际上,随着 Kimi 的爆火,有关其技术处理能力和商业化路径的质疑声也不断。

  齐镗泉也提示了风险,“随着 AI 技术的广泛应用,我们也应该关注其可能带来的数据安全和隐私保护等问题,并积极寻求解决方案。”

  Kimi 到底表现如何?

  “用过一次 Kimi 后,现在大部分时候都选择使用它。”不少人和李琳的做法一样,长期需要阅读大量数据和报告的证券分析师张强最近也在使用 Kimi,在他看来,Kimi 界面更友好,在文生文的大模型中,更贴近自己的需求。

  张强已经获得 Kimi 的 200 万字长文输入内测资格,他经常将一些上市公司的年报或者 IPO 文件全文输入到 Kimi,他对《听筒 Tech》表示,Kimi 能够迅速将核心内容提取出来,包括上市公司的基本信息、财务概览、公司治理等核心内容,“相对而言,其他国产大模型在归纳总结方面有所欠缺。”

  Kimi 的用户体验到底如何?《听筒 Tech》对 Kimi、文心一言、通义千问、豆包,以及腾讯混元助手做了一系列小测试。

  首先测试的是这些大模型对资料的总结能力。

  需要说明的是,在几家大模型的 PC 端版本中,Kimi、通义千问、豆包、文心一言对文件上传功能操作友好,而腾讯混元助手 PC 端对文档的上传界面不太友好,《听筒 Tech》几经折腾,都未能找到将文件上传到对话中的办法。

  《听筒 Tech》随意抽取了一份最新的《美团 2023 年财务报告》进行测试,测试结果如下。

  从左至右分别为:Kimi(上)、豆包(下)通义千问(上)、文心一言(下)来源:《听筒 Tech》截图

  从测试结果来看,正如张强所言,Kimi 对文档的归纳总结功能明显优于其他几家大模型。对这份财务报告,Kimi 的总结清晰且简明扼要,豆包和通义千问虽然也能总结,但结果呈现并不理想,而文心一言则需要进一步的指令。

  随后测试的是用户常用的资料检索和整理功能,《听筒 Tech》对各大模型进行了“阅读 GTC 大会黄仁勋的演讲”的测试,结果如下。

  从左至右分别为:Kimi(上)、豆包(下),通义千问(上)、文心一言(中)、腾讯混元助手(下)来源:《听筒 Tech》截图

  从大模型的检索结果来看,Kimi 准确且精简地对黄仁勋在 2024 年 GTC 大会上的演讲内容进行了总结。

  除 Kimi 外,其他几家大模型均无法检索到黄仁勋在 GTC 大会上的演讲内容,腾讯混元助手甚至无法生成任何答案,需要进一步的指令。

  创作能力是每个大模型都要具备的重要能力之一,这能够更好地理解和模拟人类的思维过程,从而生成更具创意和价值的内容。

  视频脚本的生成,便是用户常用的文学创作能力大模型功能之一。为此,《听筒 Tech》测试了大模型的视频脚本制作能力。

  本次测试的内容是“以‘运动改变生活’为主题生成视频脚本”。从生成的结果来看,Kimi、文心一言、通义千问、豆包均能生成符合基本要求的视频脚本文案。

  从左至右依次为:Kimi(上)、文心一言(下)豆包(上)、腾讯混元助手(中)、通义千问(下)来源:《听筒 Tech》截图

  其中豆包生成的视频脚本包含了时长、地点等元素,相对比较专业。Kimi 与文心一言生成的脚本内容更为连贯且有条理。而腾讯混元助手甚至将上一个问题混淆到了脚本中。

  从测试结果来看,Kimi、文心一言、通义千问和豆包都具有较强的视频脚本生成能力,可以为视频制作提供很好的帮助。相比之下,腾讯混元助手对问题的理解显然不够。

  从以上简单的综合测试结果来看,实际上,在文生文的基础功能上,Kimi 的处理结果更贴近基础用户的需求。

  对于像李琳以及张强这样的基础用户而言,Kimi 目前的文生文基本功能已经远超其他国产大模型。

  当然,他们也期待 Kimi 能够解决更多问题,李琳笑言,“我已经期待它帮我做 PPT 了。”

  为什么出圈的是 Kimi?

  Kimi 到底是谁?

  公开报道显示,Kimi 的母公司为北京月之暗面科技有限公司(以下简称“月之暗面”),创始人为杨植麟。

  企查查数据显示,月之暗面成立于 2023 年 3 月,同年 10 月推出全球首个支持输入 20 万汉字的智能助手产品 Kimi。 

  创立至今短短一年时间里,月之暗面已经获得红杉中国、真格基金,以及阿里巴巴、小红书、美团等知名机构和企业在内的两轮融资,融资金额超 12 亿美元,投后估值已约 25 亿美元。

  今年年初,Kimi 的访问量开始上涨。据 Similarweb 和七麦数据的资料显示,2024 年 2 月 18 日至 3 月 16 日,Kimi 的日均浏览量将近 20 万次,Kimi 在全平台的累计下载量为 50 万次。

  尤其是最近两周,Kimi 的访问量更是爆增。根据 Similarweb 数据显示,近两周 Kimi 的访问量分别为 152.0 万和 225.0 万,一度引发平台访问异常的情况。

  在众多国产大模型中,为什么出圈的是 Kimi?

  在王明看来,一方面,与其创始人团队的背景不无关系。“从公开的资料来看,月之暗面可以称得上汇集了目前国内大模型领域相对领先的人才的一个团队。”

  公开资料显示,杨植麟出生于 1992 年,被誉为最年轻的中国大模型创始人。其本科毕业于清华大学计算机系,师从清华教授、知名 AI 学者唐杰。博士毕业于卡内基梅隆大学计算机学院,师从苹果 AI 研究负责人 Rualan Salakhutdinov 和谷歌首席科学家 William Cohen。

  据公开报道,杨植麟目前仍是清华大学交叉信息研究院(以下简称“交叉信息院”)的助理教授。要知道,交叉信息院涵盖大名鼎鼎的清华“姚班”。杨植麟与图灵奖得主杨乐昆(Yann LeCun)和约书亚·本吉奥(Yoshua Bengio)均有过科研合作。

  实际上,月之暗面是杨植麟第二次创业,在此之前,他曾与别人共同创立了循环智能,也拿到了红杉中国的投资,并在 2021 年和华为云联合推出了当时全球最大的中文语言模型“盘古”。

  另据媒体报道,月之暗面的核心团队成员在大模型方向有重要发明,如 RoPE 相对位置编码和 group normalization,这些技术是 Meta LLaMa、谷歌 PALM 等主流模型的重要组成部分。其另外两位创始人周昕宇和吴育昕,同样是 AIGC 领域的领先技术人才,有过 1 万+的 Google Scholar 的引用。

  一位在学术上与杨植麟有交集的 AI 领域研究学者 Liam 认为,月之暗面的团队可以称得上目前国内领先的 AGI 团队之一,他亦认同业界对杨植麟“坚定的 AGI 信徒和有技术号召力的创始人”的评价。

  Liam 对 Kimi 的出圈并不意外,“实际上,AI 技术圈内的人从去年几家公司宣布做 AGI 的时候,就基本确定月之暗面和智谱是最有希望做成的,也正因此,头部资本会在第一时间挤向这几家公司。”

  在 Liam 看来,杨植麟是一位“为数不多的善于从第一性原理思考问题的学者”,“Kimi 走的 long-context 的技术路径与大厂不一样,或许也是源于其对第一性原理的思考。”

  另一方面,“杨植麟对什么是用户真正需要的大模型也有清醒的认知”。Liam 向《听筒 Tech》透露,在杨植麟看来,一个好的产品,应该知道用户想要什么,通过满足用户的需求来实现产品的优化,“这也是为什么月之暗面一开始推出的产品便是 TO C,而不是 TO B 的原因所在。”

  在 Liam 看来,“TO C 的定位,能够给 Kimi 带来更多‘训练’的机会,更有利于产品的优化和完善。

  市场显然也认可杨植麟对 Kimi 的这一定位,国信证券的分析报告指出,Kimi 日活用户的显著增长反映了 Kimi 在模型优化、人才扩展和用户吸引方面的成功策略。

  “Kimi 的成功不仅依赖于其技术优势,更在于其对用户体验的重视,包括通过数据驱动的持续产品优化、创新的分享机制以及对核心功能的精准打磨,这些因素共同提升了 Kimi 的市场竞争力。”

  中信建投也在其研报中表示,“月之暗面打造高关注度应用 Kimi Chat,一方面在于核心团队技术背景深,另一方面在于产品面向C端免费开放,注重产品运营。

  在齐镗泉看来,用户需要的,是一个能解决特定场景中 80% 问题的大模型、一个结合了本土用户使用习惯的本土化大模型、一个能够与用户进行交互和共创的大模型。

  “大模型始终会是’应用为王‘。大模型需要提供的并不是一个浅尝辄止的工具,而是一套标准化的流程支持,包括基础大模型、完整的工具链、丰富的应用,以及有专家支持的服务。”

  这些,或许就是 Kimi 率先出圈的原因。

  Kimi 火速出圈还有一个原因,那就是前期异常低调,之前几乎没人听过这家公司的名字,这与大厂在 AI 方面的高调形成鲜明的对比。

  如果说财大气粗的大厂更要面子,那么“草根出身”的 Kimi 则更注重里子。

  Kimi 能火多久?

  爆火的 Kimi 能否如愿在大模型这一新战场中脱颖而出?目前来看,尚无定论。

  仅从 Kimi 引以为傲的长文本处理技术来看,Kimi 或将面临巨大的压力。

  一个不容忽视的事实是,Kimi 大模型爆火后,大厂正在迅速跟进。

  3 月 22 日,阿里通义千问宣布免费开放 1000 万字长文档处理功能,成为全球文档处理容量第一的 AI 应用。随后,360 宣布智脑正式内测 500 万字长文本处理功能,该功能入驻 360AI 浏览器。另据媒体报道,百度也将免费开放 200-500 万长文本功能。

  在一位 AI 技术人员看来,“长文本处理这项技术并不难,只不过之前的大模型关注点不在这一方面。更重要的是,长文本处理相对而言,成本太高,甚至可以说是’亏本的生意‘。”

  该 AI 技术人员认为,“当市场意识到这一技术能迅速打开市场,势必会加入这一战场,这无疑将对 Kimi 造成巨大的压力 。”

  实际上,一个简单的测试便能看出,该 AI 技术人员的观点存在一定的道理。

  因目前尚未获得 200 万字的内测资格,《听筒 Tech》对 Kimi 与通义千问分别提交了一份近 35 万字的《茶百道聆讯后资料集》,发出相同的指令后,kimi 反馈“超出字数限制,只阅读了前 31%”,而通义千问顺利对全文进行了总结。

  一定程度而言,开放了 1000 万字长文档处理功能的通义千问,虽然总结的内容不尽如意,得到的直观结果优于 Kimi。

  图:目前 Kimi (左)与通义千问(右)对长文档的处理结果来源:《听筒 Tech》截图

  不过,Liam 对以上 AI 技术人员的看法持不同观点,Liam 表示,“长文本处理这项技术并不难”这个说法存在误解,准确地说应该是“将文本变长确实不难”,但是“在变长的同时不丢掉有效信息,保证模型对文本仍然有很深入的理解”存在很大技术难度。

  在 Liam 看来,“在文本变长甚至变到无限长的情况下,保证计算量和计算成本可控”这件事,需要大量的基础研究来支持,大厂的人才密度不足以支撑这样的研究。

  另一方面,从多次宕机的情况来看,也意味着 Kimi 后台需求解决的问题仍不少。

  上述 AI 技术人员表示,虽然月之暗面确实汇集了一些领先的技术人才,但还需加强,“我看媒体报道,目前 Kimi 团队不足百人,这对于一家处于上升期的大模型企业而言,远远不够。”

  不过,在 Liam 看来,人才密度是顶尖科技公司最关键的因素,而不是人才数量。

  “这从 OpenAI 便能得出答案,ChatGPT 发布时,OpenAI 也仅 100 余人,都是领域内最顶尖的科学家和工程师,当然 GPT 爆火后,OpenAI 开始大力扩招,人才密度有所下降,也因此引发了一些问题。”

  另外,Kimi 要想持续发展,就必须正视商业化这一难题。

  目前,月之暗面的具体商业化路径仍未对外公开。Kimi 爆火时,有媒体报道称,月之暗面相关负责人提到,年内将有商业化初步方案。

  有业内人士称,Kimi 的商业化可能类似于 OpenAI,更倾向于一种通用性的商业化,例如商业化的高端接入入口用以扩展客户的应用等。

  但这一模式能否落地,能否足以支撑 Kimi 的长远发展,尚未可知。

  在王明看来,如果目前 Kimi 的获客成本真像媒体报道的“每天投入可能超过 20 万元”,那显然不是一个小数目,目前的商业模式也不足以支撑其未来的快速发展。

  更重要的是,Kimi 爆火后,进一步推动了“百模大战”的升级,国内外 AI 公司对其已形成围猎之势。

  且不说国外,仅国内,腾讯、阿里、百度、科大讯飞、商汤科技等巨头和 AI 公司都纷纷推出了大模型,同时,各行业也不断涌现垂类大模型。

  公开数据显示,目前,国内公布的大模型数量已超过 200 个。“这些对 Kimi 而言,都是巨大的压力。”王明直言。

  在此前接受媒体的采访时,杨植麟曾表示,“AI 不是我在接下来一两年找到什么 PMF(Product/Market Fit,产品/市场契合),而是接下来十到二十年如何改变世界。”

  这或许不是杨植麟一个人的愿景,也是众多国产大模型从业者所希冀的未来。(文中李琳、王明、张强、Liam 均为化名。)

  参考资料:

1、《Kimi 掀起国产大模型长文本竞赛》,来源:《北京商报》; 2、《互联网大厂,集体「围剿」Kimi》,来源:《新浪科技》。

更新时间 2024-05-02 08:21:17