AI,无处不惊喜

2023-05-30 10:48
发明与创新·初中生 2023年4期
关键词:人脸机器语音

近日,一款名为ChatGPT的智能聊天机器人“火爆”全网,掀起了人工智能(AI)新的浪潮。ChatGPT的厉害之处在哪?除了跟人聊天,AI还在哪些领域表现优异?AI会取代人类吗?……本期,让我们在一个个具体的应用场景中,感受AI技术“狂飙”的速度!

同学们,你们了解人工智能吗?简单来说,人工智能是研究和开发能模拟、扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,其研究的目的是促使智能机器会听、会看、会说、会思考、会学习、会行动。

1956年,约翰·麦卡锡、马文·明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能”这一概念。如今,60多年过去了,以深度神经网络为代表的人工智能技术飞速发展,实现了从“不能用、不好用”到“可以用”的技术突破,在绘画、文学创作、视频、音频等方面不断带给人们惊喜。

2022年8月,游戏设计师杰森·艾伦的绘画作品《太空歌剧院》获得了新兴数字艺术家竞赛“数字艺术/数字修饰照片”类别一等奖。据报道,参赛者没有绘画基础,是通过AI绘图软件Midjourney耗时80个小时才创作出了该作品。

近年来,AI绘画成为国内外社交网络争相讨论的热点话题,各类AI绘画平台纷纷涌现。借助AI绘画软件,哪怕是绘画“小白”,只需要动动手指,输入几个关键词或直接输入相关图片,再选择自己喜欢的画风和视角,AI“画师”便可自动生成一幅笔触细腻、构图精美的画作。

AI繪画本质上是通过人工智能算法作画,其创作过程是AI系统通过学习大量的人类绘画作品数据,从而对绘画产生一定的趋向性认识,继而从已有的图像中提取数字特征,并根据训练图像的风格创建一幅新画。

这种模式也使AI绘画无法对最终生成的结果进行精准控制。在网络上,类似“狗狗变美女”“男生变女生”等AI绘画“翻车”现场比比皆是,它们在让人忍俊不禁的同时,也暴露出AI绘画距离真正被人类利用还有一段路程要走。

2017年,微软亚洲研究院研发的AI“小冰”出版了人类历史上第一部人工智能诗集《阳光失了玻璃窗》,其中包含139首现代诗;2018年,AI创作的第一部小说1 The Road出版;2022年,谷歌子公司DeepMind发布剧本写作模型Dramatron,它能从用一句话表述的戏剧冲突中生成剧本标题、角色、场景、对话;等等——越来越多的AI文学创作案例进入公众视野。

你们一定会好奇,AI的写作能力究竟如何?有人在AI中文诗歌自动生成系统——“九歌”上进行了测试。该系统由清华大学团队研发,由多个专门为中文诗歌生成设计的深度学习模型组成,运用超过30万首古人诗作进行训练,支持生成集句诗、绝句、词等不同体裁的诗歌。

测试者以“池塘”和“春雨”为主题词,让“九歌”创作一首五言绝句,系统迅速给出了以下答案:“春雨暗池塘,垂杨扶短墙。月明山色淡,风静水声凉。”这首诗对仗工整,意境优美,由此可见,AI创作的诗歌达到了一定的水平。

不过,虽然人工智能可以根据算法逻辑模仿人类创作出文艺作品,但它无法模拟人类基于历史经验、生命体验而产生的情感与意识,更难像人类那样睹物思人、托物言志。这是目前人工智能无法创作出伟大作品的重要原因。

一提到“AI换脸”,就不得不提Deepfake技术。Deepfake是由“deep machine learning”(深度机器学习)和“fake photo”(假照片)等意义组合而成的一个词,可以理解为机器通过深度学习而制造出假照片、假视频等虚假产物。该技术最常见的应用就是“AI换脸”,即在视频中将一个人的脸部移植到另一个人的脸上。

换脸时,机器先要识别出人脸的位置。由于换脸用的素材与待换脸视频中的人脸的朝向、表情等往往不同,因此,识别出人脸位置后,机器要进一步对人脸进行校准。通过寻找面部具有鲜明特征的区域,机器可以确定每一帧画面中人脸的朝向、表情,进而将待换脸视频中需要插入的人脸与素材匹配。

AI技术的迅速发展使得人机交互变得越来越频繁,“语音合成”作为人机交互中的重要一环,可使人类与计算机的交流更加方便。

语音合成又称文语转换,是将输入的文字信息转化为可听的、连续的语音,赋予机器“说”的能力。在语音合成技术领域,国内的科大讯飞公司一直保持着领跑者的地位。

目前,科大讯飞通过将发音内容、情感、音色进行解耦,实现了对情感及音色的自由控制并输出合成语音,让智能语音更具“人味”。不同的行业可根据自身的特点和应用场景进行选择。如讲座类场景可选择音色稳重又有亲和力的发音;面对小朋友,发音者的音调可以更加活泼;在新闻播报场景中,有力量感、庄重的声音则更加合适。

2022年12月,美国人工智能公司OpenAI发布了自然语言生成式模型ChatGPT,这是一种基于GPT-3(生成式预训练模型)技术的聊天机器人,它可以通过人工智能模型来与用户对话,并自动理解用户的问题,提供更精确、更有价值的信息。

相比GPT-3,该模型回答问题的方式更加贴近人类,具备记忆能力,可实现连续对话,同时还具备修改代码、撰写论文、诗歌创作等能力。

虽然ChatGPT表现突出,但也引发了不少争议。有人认为它会成为高校学生写论文、考试的“作弊神器”,也有人认为它代表了人机协同的未来趋势。

复旦大学计算机科学技术学院副院长彭鑫表示,ChatGPT可被看作是一个智能助手或一个聪明的秘书,它非常擅长分析、整合既有的知识,并通过人机对话的方式不断生成文本内容。“区别于此前常见的分析决策型AI,如人脸识别,ChatGPT属于所谓的生成式AI,代表了目前以大数据和大算力为基础的深度学习技术发展新高度。”

与其他AI应用一样,ChatGPT在为用户提供方便的同时也面临诸多法律风险和安全、伦理方面的挑战,如何对相关技术进行监管,从而让人们更好地利用新兴技术,是全社会今后需要思考的问题。

小编说:除了以上这些应用,人工智能还在多个领域大放异彩:在交通领域,无人驾驶技术方兴未艾;在医疗领域,医生能在人工智能的辅助下更快、更准确地得出诊断结果;在家居领域,扫地机器人等已走入寻常百姓家;在教育领域,教师利用人工智能提高教学效率,越来越多的学生了解、学习人工智能相关知识;等等。

值得赞赏的是,有的青少年充分发挥自己的创造力,发明出很多与人工智能相关的作品。如长沙市雷锋中学唐琮浩、谢涵制作的“人工智能交互式饮水机”就曾在第121届巴黎国际发明展上斩获大奖。

相信在未来,人工智能会发展出一条既能满足人们需要,又不阻碍人类发展的路,为我们的生产生活提供更多的便利。

同学们,对于人工智能,你们有哪些憧憬与想象呢?欢迎来信与我们交流。

猜你喜欢
人脸机器语音
机器狗
机器狗
有特点的人脸
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
三国漫——人脸解锁
未来机器城
马面部与人脸相似度惊人