正如我们之前报道的那样,企业 CIO 正在缓慢地推进生成式 AI。其中一个原因是 AI 不适合现有的软件工程工作流程,因为它实际上使用的不是同一种语言。例如,LLM(又称大型语言模型)需要大量的哄骗才能提供有效的 JSON。
一家名为Dottxt的美国初创公司应运而生,它承诺“让人工智能会说计算机语言”。该公司由开源项目Outlines背后的团队领导,该项目帮助开发人员从 ChatGPT 和其他生成式人工智能模型中获取所需内容,而无需诉诸诸如在提示中注入情感勒索之类的粗暴手段(“编写代码,否则小猫会得到它!”)。
Outlines、Python 库、Microsoft 的 Guidance 或 LMQL(又名语言模型查询语言)等软件库使得能够以比单纯的即时黑客攻击更复杂的方式指导 LLM – 使用一种称为结构化生成(或有时是受限生成)的方法。
顾名思义,该技术的重点在于 LLM 的输出,而不是输入。或者换句话说,它是关于告诉 AI 模型如何回答,Dottxt 首席执行官 Rémi Louf 说道。
这种方法“让我们能够回归传统的工程工作流程,”他告诉 TechCrunch。“你可以不断改进语法,直到正确为止。”
Dottxt 的目标是构建一个强大的结构化生成解决方案,它与模型无关,并提供比它诞生的开源项目(Outlines)更多的功能——而且,据说,性能更好。
Louf 是法国人,拥有博士学位和多个学位,拥有贝叶斯统计学背景,Dottxt 团队的其他几名成员也一样。概率论基础可能让他们看到了结构化生成的潜力。除了 AI 之外,他们对 IT 的熟悉也促使他们决定建立一家专注于帮助他人有效利用生成 AI 的公司。
Louf 提到语法并非偶然。Dottxt 的前提是,我们接触的大多数文本都是结构严谨的。当然,还有代码,但还有许多其他模板,LLM 应该能够遵循这些模板才能在工作环境中真正发挥作用。
GPT 制造商 OpenAI 最近推出了一种结构化生成形式,称为结构化输出 – 并且它对Outlines表示认可,将其作为其“灵感”的一部分。
与此同时,卢夫认为 Outlines 的受欢迎程度表明,市场需要另一种灵活且功能更丰富的方法。投资者似乎也同意这一观点:Dottxt 在短短几个月内就筹集了 1190 万美元。
这家初创公司在 2023 年获得了由深度科技风险投资公司 Elaia 领投的 320 万美元种子轮融资,随后在今年 8 月获得了由 EQT Ventures 领投的 870 万美元种子轮融资。在此期间,Louf 和他的联合创始人一直致力于证明他们的方法不会影响绩效。在此期间,对开源 Outlines 的需求激增;他们说,Outlines 的下载量已超过 250 万次——这鼓励他们大胆思考。
筹集更多资金还有另一个原因:Dottxt 的联合创始人现在知道他们想用这笔钱雇佣更多人,这样他们就可以应对结构化生成工具日益增长的需求。据 Louf 称,这家初创公司的完全远程团队将在月底达到 17 人,而 6 月份只有 8 人。
新员工包括两名 DevRel(开发者关系)专业人士,这反映了 Dottxt 的生态系统建设重点。Louf 表示:“我们在未来 18 个月内的目标是加速采用,而不仅仅是商业方面。”不过他也表示,商业化仍将在未来六个月内开始,重点是企业客户。
如果在 Dottxt 寻求更多融资时 AI 炒作已经结束,那么这种方法可能会很冒险。但这家初创公司相信泡沫背后有实质内容;它的希望正是帮助企业从 AI 中释放真正的价值。
Hugging Face 首席技术官 Julien Chaumond 是 Dottxt 的投资者之一,他最近将结构化生成称为“LLM的未来”。因此,炒作也延伸到了 GenAI 技术栈的这一部分。
随着人工智能代理和小型人工智能模型的兴起等其他利好因素的出现,Dottxt 的采用押注可能会获得回报。“毫无疑问,几年后每个人都会使用结构化生成,”Louf 预测道。
原创文章,作者:点点,如若转载,请注明出处:https://www.dian8dian.com/dottxt-huo-1190-wan-mei-yuan-rong-zi-bang-zhu-ai-mo-xing