汇集10名精英、成立仅2个月的Cognition端出世上第一款「AI工程师」,拥有独立作业、编写程式的强大能力。
世上首位虚拟的AI工程师诞生了!
世上首位虚拟的AI工程师诞生了!而且不是出自微软、OpenAI、Google等科技巨头,而是由仅仅成立2个月的新创公司「Cognition」所打造的Devin AI,懂得写软体、架网站,能够熟练运用各种工程工具,缴出远超其他AI模型的程式能力。
「来认识Devin,这是世界上第一个完全自主的AI软体工程师。」Cognition在官网上表示,「Devin是一位从不会疲倦、技术熟练的队友,准备好和你一起完成工作,或者独自完成任务供你检查。」
首位AI工程师Devin有多厉害?能自主架网站、写程式
根据《彭博社》报导,Devin AI类似由微软推出的AI助手Copilot,但能力更上一层楼,它不单可以做到提供编写程式的建议、完成部分任务,还能独自承担一整个软体或网站开发专案,好比说若要它「建立一个搜罗雪梨所有义大利餐厅的网站」,Devin会自动搜集餐厅电话、地址等资讯,建立罗列这些资讯的网站。
而根据Cognition的官网,Devin甚至拥有「成长」的能力,它可以藉由阅读文章,学习原先不懂的技术,还会自主寻找程式码中是否存在错误,并且进行修正。另外,Devin还能够训练及微调自己的AI模型,而需要的仅仅是提供它GitHub上储存库连结。
Cognition指出,他们利用SWE-bench测试Devin解决程式问题的能力,并成功解决13.86%的问题,远远超过由Claude 2缔造的1.96%技术。即使是有人从旁协助的情况下,过去AI模型最多也只解决4.8%的问题。
SWE-bench是测试系统自动化解决现实问题能力的资料库,从12个领域搜集多达2,294个问题。
Devin自主解决问题的能力远超当前其他模型。图/ Cognition
目前Devin还未完全对外开放使用,想抢先体验者需要在官网递交申请书,进入等待清单中排队。不过根据外界实际测试的感想,Devin可以在5到10分钟之内从零到有建立一个网站,并且可以在同样的时间里建立网页版的《乓》──史上第一款电子游戏,虽然仍需要多次输入提示改善,成果已经让人满意。
电脑科学家阿尔伯蒂(Silas Alberti)指出,Devin给人感觉不像只是一个能够编写程式的AI助手,更像是一个可以独立作业的真正员工,「这感觉非常不一样,因为它是一个真正可以帮你做事的自主系统。」
Cognition指出,有了Devin后工程师可以专注在更有趣的难题、团队能够实现更具野心的目标──某种程度来说,是委婉表示Devin并不是为取代工程师,而是协助工程师而生的AI助手。
Devin背后10人团队揭秘:Cognition人才济济,曾夺10面奥林匹亚金牌
短短时间打造出Devin的Cognition究竟是何方神圣?许多人势必都没听过这间公司,因为才成立短短2个月,直到发布Devin前而且行事非常低调。不过Cognition目前已获得知名创投家彼得.提尔(Peter Thiel)旗下Founder Fund领投2,100万美元,其他投资者还包括前推特高管艾拉德.吉尔(Elad Gil)。
Cognition是由27岁的执行长史考特.吴(Scott Wu)、技术长史蒂芬.郝(Steven Hao)及产品长瓦尔登.严(Walden Yan)三人共同创立,目前团队仅仅10人──不过个个是人才,声称他们已从国际奥林匹亚资讯竞赛获得多达10面金牌,并且曾在DeepMind、Scale AI、Waymo等众多企业从事AI相关工作。
彼得.泰尔领投了Cognition的2,100万美元融资,认为他们有着与OpenAI、DeepMind匹敌的能力。图/ Gage Skidmore from Flickr
技术长史蒂芬.郝先前是AI标注公司Scale AI的顶尖工程师、而技术长瓦尔登.严则直到前阵子还是哈佛学生──还没告诉父母辍学的事。史考特.吴和同在公司的兄弟尼尔.吴(Neal Wu)从青少年时就是国际程式比赛的常胜军,还是国家队选手。
「我在9岁时开始学习写程式,那时我就爱上这种能让点子成真的能力。」史考特.吴曾在X上提到。
值得一提的是,Cognition亮相后网路上也疯传一部据称是2010年史考特.吴参加Raytheon Mathcounts数学比赛的影片,他以极快的速度解出考题按铃抢答,甚至出题者还未念完整道题目,他就已经在心中计算出正确答案。
史考特.吴指出,教导AI成为工程师很像他们过去参加比赛一直在做的事,不过现在有机会在到AI系统当中编写程式。对于他们究竟如何打造出Devin,他仅声称团队找到了将大型语言模型与强化学习(Reinforcement learning)结合的独到办法,没有透露技术细节。
彼得.泰尔在声明中表示,他的创投并不常投资AI公司,但他认为Cognition有着足以与DeepMind、OpenAI、Scale AI等当红AI公司比肩的实力。