人工智能正在风靡一时——尤其是文本生成人工智能,也被称为大型语言模型(类似ChatGPT的模型)。在最近对约1000家企业组织的调查中,67.2%的人表示,他们认为到2024年初采用大型语言模型(llm)是头等大事。
但障碍重重。根据同一项调查,缺乏定制和灵活性,加上无法保护公司知识和知识产权,过去和现在都阻碍了许多企业将llm部署到生产中。
这让Varun Vummadi和Esha Manideep Dinne思考:企业法学硕士采用挑战的解决方案是什么?为了找到这样的法学硕士,他们成立了Giga ML,这是一家初创公司,它建立了一个平台,让企业可以在内部部署法学硕士——表面上是在削减成本的同时保护了过程中的隐私。
Vummadi在接受TechCrunch电子邮件采访时表示:“数据隐私和定制法学硕士是企业在采用法学硕士解决问题时面临的最大挑战。“Giga ML解决了这两个挑战。”
Giga ML提供自己的一套法学硕士“X1系列”,用于生成代码和回答常见客户问题(例如“我的订单什么时候能到?”)等任务。这家初创公司声称,这些基于meta的Llama 2构建的模型在某些基准测试上优于流行的llm,尤其是在MT-Bench对话测试集上。但很难说X1的质量如何;记者尝试了Giga ML的在线演示,但遇到了技术问题。(不管我输入什么提示,应用程序都会超时。)
尽管Giga ML的模型在某些方面更胜一筹,但它们真的能在开源、离线llm的海洋中引起轰动吗?
在与Vummadi的交谈中,我感觉到Giga ML并不是在试图创建性能最好的llm,而是在构建工具,允许企业在不依赖第三方资源和平台的情况下对llm进行本地微调。
Vummadi表示:“Giga ML的使命是帮助企业在自己的本地基础设施或虚拟私有云上安全高效地部署llm。Giga ML通过一个易于使用的API简化了培训、微调和运行llm的过程,消除了任何相关的麻烦。”
Vummadi强调了离线运行模型的隐私优势——这种优势可能对一些企业具有说服力。
Prediba低代码人工智能开发平台se发现,由于公司的限制,只有不到四分之一的企业愿意使用商业法学硕士担心与供应商共享敏感或专有数据。近77%的人回答调查的参与者表示,他们要么不使用,要么不打算在生产原型之外使用商业法学硕士,理由是与隐私、成本和缺乏定制相关的问题。
Vummadi表示:“高级管理层的IT经理发现Giga ML的产品很有价值,因为它可以安全部署llm,根据特定用例定制模型,并快速推断,从而确保数据合规性和最高效率。”
迄今为止,Giga ML已经从Nexus Venture Partners、Y Combinator、Liquid Ventures、8vdx等多家公司获得了约374万美元的风投资金。Giga ML计划在近期扩大其两人团队,并加大产品研发力度。Vummadi表示,部分资金也将用于支持Giga ML的客户群,目前包括金融和医疗保健领域的未具名“企业”公司。