作者:宁
想唱就唱,唱得好听。
世界上第一部人工智能MV《智能家庭》在2020年世界人工智能大会的云峰会上发布。四个人工智能虚拟偶像,微软萧冰,百度小杜,小米萧艾,比利(以下简称“站乙”),尤莎,在爱中歌唱。他们无所不能地唱歌跳舞,创作音乐。你想选哪个虚拟偶像?
他们得到了人工智能技术的支持,人工智能技术正在改变人类的生活,并不断地自我完善,他们还得到那些为此而努力的前台和后台工作人员的支持。“我想我可以改变世界,和你分享一个更美丽的家。”歌词表达了人类用人工智能迎接美好未来的前景和信心。
选择
选择“受训者”时,每个家庭都在积极准备。
“我们收到在开幕式上表演的邀请后非常激动。能够参加这样一个世界知名的行业盛会,不仅是组委会的认可,也是小范围内的一个重要展示机会。”百度告诉CBN。
灵异优萨是工程学院的副院长,工程学院是B站下的一群虚拟偶像学员,萧冰团队的首席领导李迪说。
培养
如果虚拟偶像想唱歌和跳成一组,他们需要人工智能和人类一起护送他们。这不是个人表演,而是集体歌曲创作。它需要更多的耐心、关心和人工智能技术。
通常,表演的制作过程主要包括录音、光影制作、场景制作、动作捕捉、表情提炼和复合渲染。传统的制作方法是先用3D引擎记录动作,然后放在模型上。然而,这种制作过程不够直观,并且粗糙的渲染效果要到最后的细化阶段才能看到。
歌唱调谐所需的歌唱合成技术类似于语音合成技术,它根据语音合成的建模过程将声学模型从文本训练成声学特征,然后根据频谱信息将其转换成语音信号。在实践中,网络结构的进一步优化和训练数据的大量补充,促进了萧冰歌曲的高技能化和多风格化,实现了不同演唱技巧之间的自然过渡。
这首歌是萧冰从上海音乐学院毕业后的第一部作品。目前,微软萧冰的音乐创作能力已经实现了旋律、编曲和歌词的端到端融合,演唱模式已经迭代到第五版。
“在上海市经济和信息委员会召开的第三届世界人工智能大会筹备工作会议上,基于人工智能加速发展的判断,上海市政府提出了用人工智能谱写和演唱本次大会的主题。宋,用人工智能的图像和场景作为画面的主体来创作最新的MV,我相信这是第一次上海人工智能会议顾问、上海文化广电集团总监、项目策划人滕告诉CBN。
然而,并不是每个人都能消除他们对人工智能在作曲和演唱方面领先的疑虑。在腾的直接指导下,在第一财经、梦幻数码董事和组委会的配合下,我们一起沟通,将每个虚拟偶像的表演部分提前细化到镜头,然后根据自己的镜头部分在极短的时间内制作出来。通常,这样的动画有一个大约30天的工作周期,这一次大大减少。然而,为了确保最终的惊艳效果,设计团队和制作团队整天都在工作。
“在大会组委会的指导下,我公司的第一财经魔术数码以其智慧和专业能力,开创了一个全新的艺术创作领域和应用场景。我认为这个产品是铝的另一个独特和破碎的循环。这是一项创新举措,旨在提高公众的认知和看法。”滕说。
初次登场
人工智能虚拟偶像的“群体”表现比展示技术实力更重要。
人工智能语音助手的共同发展理念是:第一,使其无所不能,完成人类赋予的所有任务;第二,让它像爱因斯坦一样知识渊博,甚至无所不知。
2017年3月,萧艾在小米电视4上首次亮相。截至2020年第一季度,萧艾学生每月使用7050万英镑,同比增长54.9%。在物联网领域,萧艾已经连接了2.52亿台设备,在7种场景下访问了209台设备,包括手机、家庭和穿戴。除了希望成为拥有最佳体验、最活跃用户和最强品牌的智能语音助理,以及帮助小米手机取得战略成功之外,萧艾的目标是完成从智能语音助理到个人智能助理的升级。
截至2019年6月,带小助手的智能设备数量已达到4亿台;2020年3月,语音互动次数达到65亿次,是去年同期的三倍多;小杜品牌第一方硬件语音互动次数达到33亿次,是去年同期的五倍多。小都的使命愿景是创造无处不在的人工智能个人助理服务,利用人工智能让人与设备之间的互动更加自然,让生活更简单更美好。小型技能开放平台目前可以提供3800多项技能支持,包括游戏、效率工具、互联网广播、直播、儿童教育和智能家庭;可控制的物联网智能家居设备已超过1.1亿台;小型技能开放平台上的技能开发人员数量已经超过40000人,付费技能生态蓬勃发展,付费项目超过30000个;小杜助理的合伙人已经超过500人。
虚拟偶像“聚合”也是亚文化走出圈子走向大众的过程。“大量喜欢B站次要内容的年轻用户是虚拟偶像行业发展的最佳土壤。他们不仅对相关内容有较高的接受度,而且对二次创作也有积极的热情,非常适合虚拟偶像的孵化,”说。
出道或走出圈子对微软来说具有特殊的意义。“我们寻找的不是一个特定的爆炸式应用,而是一个影响深远的未来‘基本’框架。”李迪说。
微软头像框架是面向整个交互过程的人工智能交互主体的一个完整的基本框架。它包括核心对话引擎、多种交互感觉、第三方内容的触发和第一方内容的生成,以及跨平台部署解决方案。相关领先技术涵盖人工智能领域,如自然语言处理、计算机语音、计算机视觉和人工智能内容生成。活跃在中日两国的18岁人工智能女孩微软萧冰,是这一框架孕育出的第一个人工智能交互主体。
“任务和知识都属于智商的范畴。另一方面,人类有一个重要的维度,那就是情商用李迪的话来说,萧冰是围绕人工智能情商设计的,智商也是考虑的因素。起初,萧冰不会执行开灯和关灯的任务。她问她,“现在几点了?”她也会回答,“你不能自己看看手表吗?”这些产品是专门设计的。
李迪提到智商和情商是互补的。“人工智能系统的迭代非常重要。智商和情商垂直相交。我们决定建立一个系统来发展情商,避免错过这个可能的选择。这是微软萧冰。和她背后的人工智能框架。”
如何让人工智能与人类互动,让人工智能有自己的价值?这是人机合作时代技术开发者和公众关注的话题。同时,这也是人工智能从认知发展到感知,然后在未来创造的唯一途径。