价值20亿美元的表情符号HuggingFace要成为机器学习的革命者

文/Kenrick Cai

五年前刚面世时,Hugging Face还只是一款面向青少年的iPhone聊天机器人应用程序。它可以分享电脑生成的脸部自拍、讲笑话、八卦自己对Siri的迷恋,可几乎没赚到什么钱。

其发生病毒式传播的时刻出现在2018年——但不是在青少年当中,而是在开发者当中。此前,Hugging Face的创始人已经开始在网上免费分享该应用程序的一些底层代码,自那以后,谷歌和微软等一些大型科技公司的研究人员便几乎立刻就开始在AI应用程序中使用这些代码。虽然这款聊天机器人如今已从应用商店里消失,但Hugging Face已成为现成的机器学习模型的中心仓库:有超过1万家机构以其作为起点,为其业务创建了AI驱动的工具。

本周一,Hugging Face首次登上了福布斯北美人工智能50强榜单,并宣布融资1亿美元,这使其估值达到了20亿美元。顶级风投机构Coatue和红杉资本成为了该公司竞争激烈的C轮融资的新投资者,并与A.Capital Ventures、Addition Capital和主要投资方Lux Capital一起,成为了这家位于布鲁克林的初创公司的主要股东。

“机器学习正在取代软件成为构建技术的新方式,”Hugging Face的联合创始人兼首席执行官Clément Delangue表示。该公司以一个看起来像做着爵士舞手势的微笑表情符号命名。“传统的技术构建方法是编写一百万行代码,但机器学习也已经开始这样做了,而且效果更好、速度更快。”

Hugging Face首席执行官Clément Delangue说:“一两年前,机器学习几乎还被视为一种赌博。现在,对于一流的公司来说,它正在成为技术构建的默认方式。”图片来源:Hugging Face

33岁的Delangue认为,Hugging Face对于机器学习的重要性就像GitHub之于软件。考虑到后者的广泛流行,这是一个充满自信的比较。如今,共有超过7,000万开发者在通过GitHub来分享代码,而在2018年以75亿美元的价格卖给微软时,其最后一次录得的收入是3亿美元。

相比之下,据三位知情人士透露,Hugging Face去年的收入还不到1,000万美元。Delangue拒绝对这个数字发表评论,但他和投资者都认为,机器学习已经成为本世纪20年代最重要的一项技术,而Hugging Face最终可以凭借自己的AI开发团队赚取数十亿美元的收入。

Lux Capital的合伙人、于2019年首次投资了Hugging Face的Brandon Reeves说:“那些你乍一看会认为是其竞争对手的公司——无论是谷歌、亚马逊还是Facebook——它们几乎都是Hugging Face的支持者。在这个生态系统里面,它给人的感觉真的像是中立国一般。”

Delangue生长在法国北部一个拥有6,000人口的小镇La Bassée。在他的回忆中,自己的童年是悠闲的,直到在12岁时获得了第一台电脑。到17岁时,他已经成为eBay上最顶尖的法国商人之一:从中国进口全地形车和越野自行车,把它们囤放在父亲的园艺设备店里,然后卖掉。

Delangue的非凡才能给eBay留下了深刻印象。于是当他进入巴黎ESCP商学院(ESCP Business School)就读之后,eBay为其提供了一个实习机会。在他代表eBay参加一个电商展会期间,另一名与会者告诉他,eBay最近收购了一款条形码扫描应用程序,但这名与会者不屑地说,条形码很快就会因为AI的进步而过时。

原来,这个人是Moodstocks的联合创始人,而这是一家利用机器学习制作图像识别软件的创业公司。“虽然团队很小,但他们做的事情与谷歌做的事情相当,而后者的员工比他们多100倍。”Delangue说道。几年后,谷歌收购了这家公司。

初创公司的灵活性给Delangue留下了深刻印象,于是他便头也不回地走上了创业之路。他拒绝了eBay延长实习时间的邀约,这样自己就可以在Moodstocks兼职工作。2012年毕业后,他又拒绝了谷歌的工作邀约,开始自己创业。

Delangue关于协作式笔记应用的想法并没有走得太远,但在关系紧密的欧洲初创企业圈里,他遇到了Julien Chaumond,后者是一位正在开发协作式电子书阅读器的企业家。两人对开放技术有着共同兴趣,并谈到了一起创办公司的事情。

那是在2016年,当时他们所在公司的发展都陷入了停滞。此时,第三位联合创始人Thomas Wolf出现了。他是Chaumond的大学朋友,后来获得了物理学博士学位,并撰写了关于机器学习的研究论文。Delangue说,他们决定采用“开放的对话式AI”的商业想法,换句话说,就是一种可以理解任何对话话题的聊天机器人,因为他们觉得这是当时自己有能力解决的最困难的技术问题。“我们都有一个梦想,那就是想和AI谈论一切内容,就像你在科幻小说中看到的那样。”

Hugging Face最初提供的产品是一个个性化的、类似电子宠物的朋友,由一种被称为自然语言处理(NLP)的AI提供支持。为了训练聊天机器人的自然语言能力,该团队还建立了一个底层库,以容纳各种机器学习模型,例如一个用于检测短信背后的情绪,另一个用于产生连贯的回应,以及用于理解不同类型对话主题的许多数据集,如体育或课堂上的八卦。

为了体现创始人的开放合作价值观,他们在GitHub上以开源项目的形式免费发布了该底层库的部分内容。另外,该公司还参与了由纽约初创公司Betaworks运营的机器人专用加速器项目,并从一众风投人士以及NBA球星凯文•杜兰特(Kevin Durant)那里筹集了种子资金。但两年后,他们的聊天机器人并没有赚到多少钱,对年轻用户也在逐渐失去吸引力。

也就在这个时候,谷歌和OpenAI的研究人员宣布开发了新型的NLP模型Transformer,并碾压了人类和当时最优秀的AI在阅读理解方面的能力。到2019年的时候,谷歌已经开始使用这种模式来支持其搜索结果。

对于那些想要利用这些NLP开展突破性工作,但又没有谷歌那样的机制来从头进行构建的组织来说,Hugging Face开源库的出现恰逢其时。随着机器学习社区将其作为部署Transformer模型的中心基地,它迅速变得热门起来。“我们在发布免费内容时并没有考虑太多,但是这个领域却炸开了锅,甚至连我们自己都感到惊讶。”Delangue表示。

Brandon Reeves是在2019年底时的一个周五,于旧金山市中心的一家咖啡馆里第一次见到Delangue的。由于害怕错过一个投资机会,他在随后的周一就以8,000万美元的估值向Delangue提供了一份投资意向书。他说,“在我投资过的公司中,有90%都是我在几周、几个月或几年前认识的,从来没有一家公司是只隔了一个周末就收到了我的投资。”

自Delangue接受了Lux Capital的支票以后,公司产品的使用量就一直在飙升。目前,开发者社群已经在Hugging Face上构建了超过10万个机器学习模型,以便让其他人可以使用这些预先搭建好的模型,而不必从头开始构建。在GitHub上,Hugging Face已经积累了多个“星星”——这是一种衡量开源项目受欢迎程度的衡量标准——其速度比Confluent(年收入3.88亿美元)、Databricks(超过8亿美元)和MongoDB(8.74亿美元)背后的项目更快。

自2016年Hugging Face成立以来,其三位联合创始人就在不同国家工作:首席执行官Delangue在美国,首席技术官Julien Chaumond在法国,首席科学家Thomas Wolf在荷兰。图片来源:Hugging Face

尽管在2021年,具有类似地位的公司获得了大量融资,但专注于成长阶段的风险资本市场已经放缓到了近乎停滞的地步。在这种环境下,Hugging Face的融资实属难得,表明了投资者对其未来依然有信心。数据领域创业生态系统中的一些人则私下里表示,他们很好奇Delangue如何能够让Hugging Face的收入增长到足以证明其高估值水平。对此,Delangue认为,如果有足够多的免费用户被Hugging Face吸引到,那么一些雇佣了这些用户的公司就会及时地掏腰包了。

“考虑到机器学习的价值和它的主流地位,其使用量就是递延收入。我真的认为,机器学习会成为技术开发的默认方式,而且Hugging Face会成为这方面的头号平台,并创造出数十亿美元的收入。”

Delangue表示,Hugging Face去年才开始提供付费功能,目前已拥有1,000多家企业客户,包括英特尔和eBay。制药巨头辉瑞(Pfizer)和罗氏(Roche)在为其企业级安全功能付费,而彭博(Bloomberg)则通过Hugging Face将机器学习应用到了自己的实时终端中,而无需自己构建基础设施。虽然微软不是该公司的客户,但它明显使用了Hugging Face作为基础来培训必应(Bing)搜索引擎,以更好地理解自然语言查询。

红杉资本合伙人Pat Grady表示:“他们优先考虑的是应用,而不是变现,我认为这是正确的做法。他们看到了Transformer模型在NLP之外的应用方式,看到了成为GitHub的机会,这不仅是面向NLP,而且会延伸到机器学习的每个领域。”

事实上,在去年一年里,Hugging Face已经在多个领域成为了机器学习模型的中心,例如用计算机视觉来训练自动驾驶汽车的图像识别,以及帮助制药公司预测新药物疗法的有效性的推荐系统。

Delangue说,Hugging Face已经接近盈亏平衡,而且之前筹集的4,000万美元还在银行里等待调用。“作为一名企业家,我个人学到的一件事是,不要过多地去思考一个长达十年的商业战略,而是应该更多地进行实验,并遵循社群的验证和他们告诉你的东西。”

Brandon Reeves则认为,如果这一愿景得以实现,其回报可能是公司上市后市值达到500亿美元或1,000亿美元。难怪Delangue说,他已经拒绝了多个“有意义的收购要约”,也不会像GitHub那样把自己卖给微软。

“我们想成为第一家以表情符号上市的公司,而不是三个字母的股票代码,”Delangue笑着说。“我们必须开始对纳斯达克进行一些游说,以确保这一点能够实现。”

未经允许不得转载:股市行情网 » 价值20亿美元的表情符号HuggingFace要成为机器学习的革命者

相关文章

评论 (0)