数据管理公司DataStax董事长兼首席执行官切特·卡普尔 (Chet Kapoor)表示:“没有数据就没有人工智能,没有非结构化数据就没有人工智能,没有大规模非结构化数据就没有人工智能。”
在 TechCrunch Disrupt 2024 大会上,卡普尔开启了一场关于现代人工智能应用背景下的“新数据管道”的对话,风险投资公司NEA合伙人Vanessa Larco和数据集成平台Fivetran首席执行官乔治·弗雷泽也参与其中。虽然谈话涉及多个方面,例如数据质量的重要性以及实时数据在生成人工智能中的作用,但其中最重要的一点是,在人工智能的早期阶段,优先考虑产品与市场的契合度而不是规模。对于想要进入令人眼花缭乱的生成人工智能世界的公司来说,建议很简单 — — 一开始不要过于雄心勃勃,而要专注于切实的、循序渐进的进展。原因何在?我们真的还在摸索之中。
“对于生成式人工智能来说,最重要的是一切都取决于人,”卡普尔说。“实际上,特警队会着手建立最初几个项目——他们不是在阅读手册;他们正在编写如何开发生成式人工智能应用程序的手册。”
虽然数据和人工智能确实密不可分,但公司拥有的海量数据很容易让人不知所措,其中一些数据可能非常敏感,需要严格保护,甚至可能存储在多个地方。Larco 与 B2C 和 B2B 领域的众多初创公司合作(并担任其董事会成员),他建议在早期阶段采用简单但务实的方法来释放真正的价值。
“回想一下你想要实现的目标——你想要解决什么问题,你需要什么数据?”拉科说。“找到这些数据,无论它位于何处,然后将其用于这个目的。”
这与从一开始就试图在整个公司范围内推广生成式人工智能不同,将所有数据都投入大型语言模型 (LLM),并希望它最终能得出正确的结果。根据 Larco 的说法,这很可能会造成不准确且昂贵的混乱。“从小处着手,”她说。“我们看到的是,公司从小处着手,使用内部应用程序,制定非常具体的目标,然后找到与他们想要实现的目标相匹配的数据。”
弗雷泽自 12 年前成立以来一直领导“数据移动”平台 Fivetran,一路积累了 OpenAI 和 Salesforce 等大牌客户,他建议企业应该把重点放在当前面临的实际问题上。
“只解决你今天遇到的问题;这是你的座右铭,”弗雷泽说。“创新的成本 99% 总是来自于你没有成功的东西,而不是来自于你希望提前计划好规模的成功的东西。尽管这些都是我们回想起来总是会想到的问题,但它们并不是你承担的成本的 99%。”
就像网络的早期发展以及最近的智能手机革命一样,生成式人工智能的早期应用和用例已经展现出人工智能赋能的强大未来。但到目前为止,它们还未必能改变游戏规则。
“我把这称为生成式人工智能的愤怒的小鸟时代,”卡普尔说。“它并没有完全改变我的生活,还没有人帮我洗衣服。今年,我合作的每一家企业都在将一些产品投入生产——规模小,内部化,但投入生产是因为他们实际上正在解决问题,如何组建团队来实现这一目标。明年是我所说的转型之年,届时人们将开始开发应用程序,这些应用程序实际上开始改变他们所工作的公司的发展轨迹。”
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/genai-mian-lin-shu-ju-guo-zai-de-wen-ti-yin-ci-gong-si-ying