现代机器学习(ML)的进展的步伐似乎一直都很快。深度学习模型第一次赢得最受欢迎的计算机视觉竞赛还只是十年前的事。可是,当 GitHub 在 2021 年底推出其“AI 结对程序员”Copilot 产品时,许多人(甚至像我这样从事 ML 工作的人!)都对现在的深度学习模型居然可以帮高技能的软件开发者自动补全代码感到震惊。在开发者用于来编码的界面里,Copilot 可以就如何完成一行代码给出建议,甚至可以根据该代码应该做什么的自然描述生成多行代码。一些用过第一版 Copilot 的工程师声称,该助手每天可为他们节省数小时的时间,甚至可以替他们编写 40% 的代码。
Copilot 是用 OpenAI Codex 的大型语言模型(LLM)开发出来的,这个模型可以将自然语言翻译成许多流行的编程语言,并利用了数千万个公开的 GitHub 代码存储库的数据进行训练。交代一下,OpenAI 是一家位于旧金山的人工智能研究公司;这家非营利组织成立于 2015 年,并在 2019 年转为营利性组织,然后从微软(微软于 2018 年收购了 GitHub )处筹集了 10 亿美元的资金进行研究。作为回报,微软拿到了对 OpenAI 的部分 LLM 的独家访问权,其中就包括 Codex。
Copilot 最终还是提供了令人信服的证据,证明当前的 ML 功能可以自动化完成越来越多的代码生成与应用开发的工作。新成立的初创企业以及既有公司已经在着手解决产品开发体验的多个方面,包括自动代码审查、代码质量改进、shell 命令自动完成、文档创建,甚至包括前端和网站生成。
Grit 是在这个领域创业的一个早期例子,它承担的是对于任何公司来说都是最可怕的工程任务,也就是所谓的“技术债务”。一旦开发者为了更快推出功能而走上编码的捷径,但却牺牲长掉期可靠性和性能时,这种债务就会累积。Grit 的产品扮演了自动化开发者的角色,可以修复许多常见问题,并根据人类对代码更改的反馈进行改进。通过将静态分析与 LLM 相结合,Grit 的愿景是能够做出可自我维护的软件。
鉴于这项技术有可能彻底改变软件开发,多家投资者已经汇编出相关公司名单,许多其他初创公司也在悄悄地开发相关技术。其中部分初创公司以 Codex API 为基础,希望通过独特的产品体验以及专有的数据飞轮形成差异化。其他的正在从头开始开发自己的模型,或者对开源模型机械能微调。随着这些公司走向成熟,不管最大收益者是人工智能基础设施提供商还是人工智能应用本身,价值主要积聚在什么地方将变得更加清晰。
Copyright © 2022 真术相成 ・ 蜀ICP备2022001576号 川公网安备 51019002005104号