人工智能技术的快速发展给各领域带来了深刻的影响和变革。 在计算机编程领域,各种代码生成工具的出现也给程序员带来了重要的挑战。 此类工具可以通过学习大量的代码,高效生成高质量的代码,极大地提高了代码编写的效率。 我们不禁思考未来的程序员该何去何从,是被取代还是与代码生成工具和谐共存,都需要深思……
2023年5月25日,以《自动代码生成是辅助还是取代程序员?》为主题的大咖炒作第43期。 如期举行。 本次活动由AI TIME和清华校友会AI大数据专委会主办、盛京网联协办。 本次活动邀请了智普AI大模型事业部副总裁兼产品经理薛宇飞、华为云PaaS技术创新实验室代码智能专家沉波、云栖无仙创始人兼CEO沉凯文、COO、高级创新李力行吉虎队。 建筑师郭旭东及五位专家参加。 活动期间,五位嘉宾就代码模型、AI代码生成时代的变化、未来软件开发等问题进行了深入讨论。 本次活动共吸引了线上线下专业观众约25000人次。
01
开放AI,大型模型有护城河吗? 开源模式颠覆了什么?
薛宇飞:“护城河”是一个相对的概念,不存在永久无法克服的技术壁垒。 不管是不是,“护城河”并没有想象中的那么深,其他大型模型公司完全有可能通过一段时间的努力赶上甚至超越他们。 开源一方面促进了大家对大模型的认知和应用,另一方面也促进了技术更好的发展。
申博:他走在大型模型技术的最前沿,正在共同推动这个领域的发展。 开源方法让其他公司或组织有机会训练可用的大规模模型。 然而,要超越and,就需要面对和突破许多未知的技术难题,而这些细节的知识和经验正是and的护城河,也是其研究越来越封闭的原因之一。 此外,高质量数据的积累也是关键因素。 较早的大规模公开发布积累了大量的用户数据,用户粘性较高,这使得后来发布的车型很难分享用户红利,包括巴德。
李力行:“护城河”是一个相对的概念,随着时间的推移会发生变化。 或者说目前他们在模型规模、数据积累、工程技术细节等方面都积累了一定的时间,具有优势。 这是他们的护城河。 开源颠覆的是相对不完整的模型和应用,让小公司甚至独立开发者有机会体验和感受大模型。
申凯文:信息流通有助于创造价值。 尽管并且本身具有一定的技术优势,但它们的“护城河”并非不可逾越。 通过开源,其他开发者可以在短期内赶上甚至超越他们,特别是在垂直模型或应用场景方面。 不过,对于先行者来说,他们的模型在模型规模、数据集、商业地位等方面已经取得了一定的优势,而后来者需要一段时间才能积累这些优势。
郭旭东:他的护城河主要体现在三个方面:人才、成本、数据集。 他们之所以有优势,是因为他们更早掌握了相关资源,布局了社区生态。 不过,我对开源持乐观态度,因为开源的颠覆是不可避免的,只是时间问题。 开源让普通用户有机会以低成本体验模型,增加底层算力,从而促进整个生态的繁荣。
02
是否需要单独的代码模型? 多大的代码模型可以满足需求?
郭旭东:现在,独立的代码生成模型是必不可少的,而这些模型往往是基于语言模型的。 但由于应用场景不同,专注于垂直领域的代码生成模型在未来的发展中将变得更加重要。 这可以降低模型的部署成本和规模,让更多的企业参与并发挥更大的价值。
沉波:有必要有一个单独的大代码模型。 从应用的角度来看,主要有两个原因:一是实际可用性的要求,二是编程语言的特殊性。 从用户体验的角度来看,用于代码生成、解释和调试的大型模型应该满足低延迟、高并发和高精度的要求。 专业码模携带。 从训练的角度来看,自然语言和编程语言有很大的区别。 与自然语言不同,编程语言实际上隐含着一种图形信息,可以看作是区别于自然语言的另一种模型。 状态,这决定了代码特定的大模型的架构和训练方法可能与自然语言的需求不同。 总之,需要有一个单独的大代码模型,但实际的软件开发既需要计算机知识,又需要世界知识,而代码大模型最好是在通用大模型的基础上推导出来的。
薛宇飞:有了通用的大模型,还是要有专用的代码模型。 在代码生成和完成方面,使用纯代码模型可以保证响应速度并降低推理成本。 我们目前也在探索使用通用模型来解决代码解释相关的问题,因为它在自然语言方面的能力更强,可以更好地解释代码。 两种模型都有各自适合的应用场景。 目前来看,百亿是代码生成模型比较合适的规模。
李力行:在代码领域,确实需要有一个专门的大代码模型,而且我们应该建立一个基于自然语言的代码模型。 代码模型对模型推理和计算资源有特殊要求,因此没有必要将其他冗余信息与代码模型结合起来。 代码语言具有独特性且受语法限制,因此代码模型的结构也值得进一步探索。 关于代码的大小,“足够”是一个很难定义的概念。 目前百亿、千亿的大模型都可以取得很好的效果,解决实际问题。
申凯文:在代码领域,确实应该有一个独立的大代码模型。 这可以分两个阶段来看:在AGI出现之前,我们可以将人类的需求分为通用需求、专业领域和长尾需求,而长尾需求仍然需要人类来调节。 AGI出现之后,它实际上可能会取代程序员的工作。 在某些场景中使用垂直模型可以减少资源消耗,为独特领域提供更多知识,并获得更准确的结果。 因此,专注于独特领域的模型可以更好地满足特定需求并提供高质量的解决方案。
03
AI代码生成时代会发生哪些变化?
沉凯文:低代码平台由于其易用性和灵活性,更容易被用户接受和应用。 然而,产品是否付费并不是衡量其质量的关键因素。 付费产品必须能够为用户创造价值,而免费产品最终需要找到合适的盈利模式,才能在维护和研发上保持可持续性。 在使用代码生成模型时,需要考虑不同的应用场景,这样才能真正满足用户的需求,发挥其应有的意义。
郭旭东:目前国内外发布的各种大型车型的能力存在差异。 它们的功能相互冲突并且仅限于较小的语言范围。 他们对代码上下文的理解有限,无法有效解决实际问题。 后续发展需要解决的一个方向。 采用的订阅式收费策略为用户提供了接受新模式的机会,这是一种改进,未来还将继续发展。 随着竞争的加剧和成本的降低,开发商将推出更好的功能。 目前我们已经将代码生成模型应用到了软件开发的很多方面,比如代码注释、代码检查、功能总结等,降低了获取信息的门槛,提高了研发效率。
李力行:免费本身就是一种商业模式。 我认为现在的收费策略是区分用户,把有限的资源留给真正需要的人。 代码生成模型的使用是一个逐渐适应和提高效率的过程。 目前大多数人都停留在Demo级别,只能通过自然语言描述来生成方法或代码。 此外,从培训教育用户的角度来看,也为很多零基础的人提供了感受AI魅力的机会。 在实际开发过程中,可以作为编程的辅助伴侣,节省时间,提高效率。 那么后期我期待有一种新的编程交互方式,可以在编写代码的过程中辅助模型提问、解释、自动定位bug或者有更高层次的应用。
薛宇飞:AI代码生成应用的商业模式将不再以个人用户为主,而是转向企业用户付费。 很多用户在使用AI产品时往往会有更高层次的需求。 当前的代码生成模型在满足用户需求方面存在局限性。 这是未来AI编程的方向。 用户还需要更详细地了解AI产品的特性,才能更好地辅助自己的工作,提高效率。
沉波:大模型将会给所有软件开发工具及其商业模式带来变化。 未来,人工智能加持下的软件开发工具应该形成免费和收费的模式。 免费提供代码生成功能有利于用户和工具开发者,降低使用门槛,扩大市场,让更多人上手,探索有趣的使用场景; 然而,只对代码生成收费,竞争力不够。 开发人员的日常工作除了代码编写之外,还包括测试、交付、维护等比较耗时的工作。 这些都是比代码生成更多的应用场景,更容易影响开发效率和质量。 到正收益。 因此,在代码生成的基本需求之上,更具体的高级功能和定制需求,如智能测试、知识问答、错误调试、安全问题或开发规范扫描等,才是具有付费价值的差异化点。 用户可以根据自己的实际需求实时选择。
04
想象软件开发的未来
申凯文:希望未来的大模型能够提供一些帮助,人类可以进行微调和优化。
李力行:未来一个人可能具有团队的能力和职能,并且作为一个团队生活。
沉波:软件研发领域是人工智能提升生产力最有潜力的方向之一。 未来,每个人都可能在某种程度上成为软件开发者。
薛宇飞:未来,编程语言可能不再存在,只有人类能够通过自然语言描述来生成可执行程序。
郭旭东:短期内会出现更多的全栈工程师,希望未来能够产生不需要人工干预的人工智能工具。
刘道全:虽然大型模型可能会替代部分工作,但更好的场景是辅助人类完成工作。
何云:大型模型推动了人类的进步,未来人类可以释放一部分能量,投入时间去完善自己的领域。
好了,今天的主题就讲到这里吧,不管如何,能帮到你我就很开心了,如果您觉得这篇文章写得不错,欢迎点赞和分享给身边的朋友。