国外智能设备虚拟助手与个人语言生物信息安全问题研究进展与趋势

2023-01-02 12:07陈美华陈祥雨

软件导刊 2022年11期

陈美华，刘畅，陈祥雨

（东南大学外国语学院，江苏南京 211189）

0 引言

虚拟助手（Virtual Assistant，VA）指能够通过用户的语音或文本指令提供服务、实现人机互动的智能软件［1］，常见于各类移动设备，如Apple Siri、Google 助手等。VA 内置语音控制为了准确捕获用户需求并做出即时响应，需长期保持监听状态［2-4］，广泛收集、存储、分享并使用用户的语音信息［5-6］。用户语音携带具有生物原始特征的声纹，一旦流失会损害其信息自决权、控制权等个人数据主权，VA对用户构成的语言信息安全挑战值得学界的关注。VA 起源于国外，且国外对其隐私问题的研究较早，而国内有关VA 安全与隐私的专门研究还十分鲜有。为更好了解与分析国际VA 语言隐私安全领域的研究现状与发展态势，为国内研究提供借鉴，本文对2014-2021 上半年间国外智能设备VA 与用户语言生物信息安全问题研究的年度分布、关键文献、研究主题等进行梳理，总结其发展历程和已有成就，以期为拓宽国内相关研究的广度和深度寻求经验路径。

1 研究方法

因综述对象涉及范畴较广泛，且以定性研究成果为主，故采用叙述性综述方法［7］，以便根据研究所需的价值标准条理分类所收集的文献资料，并作出灵活深入的分析。

1.1 文献来源

为减少叙述性综述取样对象规范性差、研究结果不够客观等缺点［7］，从期刊来源、文献类型、文献内容、文献篇幅及发表时间5 个维度制定了纳入标准（见表1），以尽量保证文献搜索及筛选合理有效。

Table 1 Criteria for literature selection表1 文献纳入标准

在仔细阅读和掌握国外VA 与隐私安全问题研究综述的前提下，确定检索条件包括：TS=（privacy OR security）AND TS=（digital assistant OR virtual assistant OR virtual personal assistant OR siri OR google assistant OR alexa），语种限制为English，文献类型限制为Articles 和Proceedings Papers。依据选取标准对研究方法和主题进行人工核查，去除明显不符合本研究需要的记录，同时手动搜索已有文献中的相关参考文献以确保样本完整性。通过检索和筛选，最终获得与VA 和用户语言信息安全相关的国外文献53篇，作为研究的主体样本，并将每条文献的题目（title）、作者（author）、摘要（abstract）关键词（keywords）等信息录入NoteExpress 软件进行后续分析。

1.2 数据分析

在精读和泛读样本的基础上，对文献数据进行编码分析。在一级编码阶段，根据发表时间、文献名称、关注群体、研究主题、研究方法进行独立编码，并重复校验直至达成内部共识。二级编码主要对一级编码进行检验、特征分析与合并。整个编码是一个回环的过程，对编码内容进行了讨论、反思和调整，以确保研究信度。

2 研究结果

2.1 年度发布

研究文献的年度分布能够直观反映该领域研究热度随时间变化情况。国际VA 与用户语言生物信息安全问题研究兴起于2014 年，至2017 年，经筛选后的期刊或会议论文只有11 篇（见图1），且以揭露问题为主，表明此时国际上对VA 语言隐私的关注度并不高。自2011 年第一款VA产品Apple Siri 上市后，公众需要时间来接受新生事物并逐渐认识到其对自身语言信息安全的影响。2019 年，相关研究数量有明显提升。当年VA 泄露用户隐私的事件一度被曝光，为回应公众关切，学界对产品的语言隐私问题研究达到阶段性高峰。2020-2021 年6 月，研究势头虽有回落但保持稳定发展，学者关注重点也由分析问题转移至对策及优化研究。近年来，VA 与用户语言生物信息安全问题研究力求回应现实问题，并已在国外取得长足发展。

Fig.1 Foreign research situation on VA and language bioinformation security from 2014 to June 2021图1 2014-2021上半年年国外VA与用户语言信息安全研究状况

2.2 高共引文献分析

共引分析能够清晰直观地展示学科研究的亲缘关系与演化规律［8］。分析国际VA 与用户语言信息安全问题研究的高共引文献有利于了解该领域的发展基础与变化轨迹。本研究提取的共引频次前10的文献如表2所示。

2.3 国外VA与用户语言信息安全问题研究

本节从关注受众、研究主题、研究方法3 个维度对所选取的文献进行分析，以期全面展示近年来国外VA 与用户语言生物信息安全问题研究的发展状况。

2.3.1 关注受众

按照研究所关注的利益群体，该领域研究的受众主要为产品的终端用户、开发人员或二者兼有。用户指VA 产品的使用者，他们通常缺乏相关的技术知识，是开发或供应商的客户；软件开发人员为消费市场提供产品或服务。如图2 所示，在所得的53 篇论文中，面向用户的论文数量多达29 篇，占比54.72%，而只针对软件开发群体的研究数量为9 篇。此外，发现部分研究（28.3%）同时针对终端用户和开发人员群体。

2.3.2 研究主题

VA 通过语音交互完成服务，利用大数据和云计算系统等接收、解释与执行一系列预定的语音指令，其安全运作涉及语音识别、云端服务器、绑定程序、数据传送和客户终端等诸多环节［9-10］。分析发现国外在VA 与用户语言信息安全挑战领域的研究主题主要分为4 类，即用户隐私行为与意愿研究、针对语言信息安全问题的解释性研究、对策及优化研究和综述研究。在针对语言信息安全问题的研究中，部分作者分析问题并提供优化建议，因此我们将其同时归为针对语言信息安全问题的解释性研究与优化研究。各主题的数量与比例如图3所示。

Table 2 Highly co-cited literature（Top 10）of foreign research on intelligent device VA and personal language bioinformation security表2 国外智能设备VA与个人语言信息安全问题研究的高共引文献（Top10）

Fig.2 Subject audience of foreign research on VA and language bioinformation security from 2014 to June 2021图2 2014-2021年国外VA与用户语言信息安全问题研究关注受众

Fig.3 Research topics，contents and quantities statistics of foreign research on VA and language bioinformation security from 2014 to June 2021图3 2014-2021上半年国外VA与用户语言信息安全问题研究主题内容及数量统计

（1）用户隐私行为与意愿研究。与VA 语言隐私问题相关的用户行为与意愿研究的发文量相对较少，共10 篇，占比18.9%。此类研究主要关注用户对VA 语言生物信息安全保护的看法及其隐私关切对产品接受度或使用行为的影响，深入探究影响用户选择的产品特性及其他因素。

首先，用户十分关注VA 的语言与身份隐私保护性能，并将其视为决定接受该类产品的关键因素［11-13］。Burbach等［12］发现自然语言处理性能、价格和隐私保护为影响用户对VA 接受度主要产品特性，且更多受访群体将对用户的隐私安全保护性能列为首要考虑；Fruchter 和Liccardi［14］通过分析用户评论得出VA 使用者的隐私与安全关切，结果显示语音数据收集范围、窃听等隐匿的设备行为为消费者主要关注的问题；Lau 等［15］则具体研究了不同群体对VA使用中可能存在的隐私风险的接受度，发现用户与非用户之间存在着不同程度的安全顾虑。非用户对安全隐患更加谨慎，反感开发商或其他软件监听私人谈话的恶意行为，而VA 用户的隐私关切则较为温和，认为开发商在提取及保护用户数据方面值得信任。考虑到不同主体对VA 的语言隐私安全特性存在不同认知，为了解其形成原因，Chalhoub 等［13］深入探究了用户的产品体验对其隐私关切的影响，结果显示不良用户体验，如发现私密语音被监听、广告弹窗等会唤起用户的隐私与安全需求，促使用户对产品性能中无益于自身隐私安全的部分采取补偿行为，如删除语音记录、停止某项服务或功能、中断物联网连接、限制设备的数据分享等。

除关注用户对VA 安全特性的宏观感知外，少量研究也聚焦用户对产品特定功能的具体看法及使用行为。Moorthy 等［16］采用大规模在线调查对用户在公共空间使用VA 披露语言信息的意愿展开了研究，结果表明受访对象对传输私人信息的态度更为保守，尤其当信息传递以明显的输入方式（如语音指令）进行时；Tabassum 等［17］的调查则关注用户对新一代无须唤醒型VA 的期望及对共享数据的看法，结果同样表明，当谈话内容敏感度较低时用户更有可能同意分享自己的对话；Ha 等［18］以通信隐私管理理论为框架，通过实验得出VA 所需用户信息的敏感程度及产品类型（拟人型与客观型）会显著影响用户的语言隐私顾虑，当服务涉及高度敏感的个人信息时，与用户构成合作关系的VA 会引起用户更大的隐私关切，降低其披露语言信息的意愿，而在处理低敏感信息时，用户则认为充当合作型服务角色的VA 更具安全性。此外，Javed 等［19］的研究关注用户对Alexa 录音及存储功能的体验及理解程度，结果显示，91%的受访者有过在不知情的情况下被VA 录音的经历，其中有53.09%的用户称被录音的片段中不包含唤醒指令。此外，虽然大多数用户（64.6%）能够意识到自己的语音将被存储，但并不了解可能接触自己录音数据的实体，更无法做到及时删除，而重视自身隐私保护的受访者对Alexa 的录音存储行为有着更清晰的认识。除常见的Alexa、Siri 等VA 产品外，McReynolds 等［20］还调查了用户对智能互联玩具Hello Barbie 和CogniToys Dino 隐私保护的看法，结果表明家长对玩具索取录音权限持混合态度，但普遍重视其安全性能，而儿童的隐私意识则十分有限，并且会以与玩具互动的方式使用Siri、Alexa 等产品，这种使用方法也导致大量的儿童语音数据暴露给VA。

综上所述，国外VA 语言隐私安全问题研究已从不同角度揭示了用户群体对涉及其语言信息安全的VA 产品特性的看法、使用意愿与具体行为。值得注意的是，虽然研究普遍表明公众对VA 保护自身语音安全方面存在顾虑，但较少有研究能够针对顾虑提出解决措施，并且隐私问题不足以劝阻用户在现实生活中继续购买或使用［21］，这也促使研究者更加关注VA 在日常运行中对用户语言信息安全造成的实际损害及相应的保护策略。

（2）针对语言信息安全问题的解释性及优化研究。在近7年的论文中，对VA 产品设计与运行中存在的语言信息安全问题进行介绍、验证与解释的文章共有24 篇，且集中发表于2017-2020 年。根据数据生命周期以及研究所揭露的安全问题类型，与VA 语言信息安全问题相关的解释性研究又可以分为语音监听、语言生物识别及身份认证隐患、外部攻击、数据最大化使用与保密存储4个分支。

语音监听是此类主题中学者较为关注的安全问题。经研究证实，VA 的语音识别与处理系统在等待唤醒词的同时，需要长期待机并对用户语音及周围噪音进行监听与存储［3，6］。Ford 等［22］的实验发现，电视音频或用户日常交谈均可以在无唤醒词的情景下触发Amazon 语音助手的录音功能，被记录的私人对话还会被传输至服务器做进一步的分析；Chung 等［2］则通过分析VA 的工作原理，指出4 种可能对系统安全与用户隐私构成风险的攻击类型，包括设备在用户未知的情况下擅自录音并将数据返还给供应商的风险。VA 监听并记录用户对话，导致用户对自身语言信息安全的可控程度大为降低。

VA 采用关键词唤醒模式同时引发了其准入门槛低、身份认证困难等安全隐患［2，10］。研究发现，在单因素身份验证模式下，播放的语音指令音频也可能触发VA 进行回应［10，23］。此外，现有的语音变形或合成技术可以基于有限的声音样本量提取合法用户的生物特征以欺骗识别验证系统，造成关键个人信息流失［24］。因此，尽管VA 的语音识别与处理技术采用数据驱动下的机器学习模式，能够根据访问者声音特性预测身份，但依旧很难给予充分的安全准入保障。

在此类主题下，更多研究者探析了VA 在传输语音数据的过程中可能遭受的各类攻击，通过录音、模仿、合成甚至篡改等多种方式远程操控并发布指令［25-26］。实证研究结果表明，不法访客能够利用人类与机器语音识别之间的差距，通过调整原始语音信号的梅尔倒谱系数特征形成对抗性输入以误导机器学习模型。此类扰动方案对声音质量的影响几乎可以忽略，但会破坏VA 深度神经网络的工作效率，极大削弱语音识别速度及准确率［27-28］。同样，实验验证音素变形能将来自不同访客的源语音转换为可以通过语音生物验证的来自正当使用者的音频［29］。发动海豚攻击的可行性得到验证，通过发送超出人类听觉上限的超声波频率隐藏恶意语言指令以实现对设备的操控［30-33］。此外，研究者们还对恶意访问者通过调频式天线［34］、激光照射等欺骗VA 语音识别及身份认证系统的方式进行了探究［35］，深入剖析攻击者如何操纵设备以获得访问权限，实施恶意或侵权行为。

关于外部攻击，鉴于VA 不断扩展的附加功能以及与物联网设备日益紧密的联系，扩展VA 原始功能可能造成的数据传输漏洞及因第三方授权而造成的用户敏感或保密信息的泄露引起研究者关注［21，36-37］。根据自然语言处理中的深度学习模型，发现了针对VA 功能启用模式的两种对抗性攻击，即语音抢注（Voice Squatting）与语音伪装（Voice Masquerading）［38］。Kumar 等［39-40］对Alexa 语音识别中可能存在的易混淆指令误读及语音抢注攻击进行了实证分析，深入讨论了其对用户隐私安全的影响。Mitev等［41］的实验则展示了恶意中间人通过扩展程序在VA 与其良性附加功能之间发动攻击的可行性，详细分析了攻击者如何通过用户家中的物联网设备远程发射超声波信号与VA 进行交互，并将用户的语音重新定向至恶意应用程序，最终达到突破Alexa 的智能识别防线、监听Alexa 与受害者之间对话的目的。此外，也有少部分研究者关注了VA 与其支持设备之间的秘密架线及电路窃听现象。尽管目前VA 与绑定设备之间的通信大多使用加密，但外部攻击者仍可通过监控网络流量获取数据传送速率并识别设备所处的工作状态［42］，通过网络流量推断语音指令的正确率高于通过机器学习模型介入［43］。

商家对收集的用户语音数据的分享与使用方式也影响着用户隐私安全。用户在商家如何使用语音数据方面尚未充分行使自决权，无法监督与控制自身的数据安全［44］。现有的VA 产品架构一般将数据集中存储于云上，一旦空间遭到入侵，大量敏感信息将面临泄露［10］。

（3）对策与优化研究。针对VA 产品设计与运行中暴露的语言信息安全问题，研究者们也提出了相应的改进方案与使用建议。经本次检索及筛选得出的对策及优化研究共有18 篇，占比33.9%，其中有半数以上为2020-2021 年发表，可见对策及优化研究已成为VA 语言信息安全问题研究中的新热点。

考虑到用户发布的语音指令中含有丰富的语言生物特征，学者就如何在确保VA 语音搜索任务执行效率的同时强化用户语言隐私保护展开了探讨。Li 等［45］提出语音加密搜索方案，采用粒计算技术对用户指令进行加密；根据Vaidya 等研究［46］，鉴于语音识别与存储的可分离性，产品在将数据传输至云端之前可采用音频处理技术去除其可识别特征，只留下执行服务所需信息。实验表明，此类措施可以有效防御语音合成攻击。此外，针对VA 窃听用户谈话、擅自记录并交易语音数据的现象，Cheng 等［47］建议使用声学标记，即VA 在接收用户声音的同时接收辅助设备发出的独特声学信号，并将此标签嵌入他们录制的音频流中。该标签不仅会向VA 合作软件或后端系统发出信号，表明用户尚未同意录制，还可用于追踪记录的拍摄时间和地点，有利于增强产品监听并录制用户语音的可控性；Sun 等［5］则提出并验证了一款能够执行隐私保护的VA配套设备MicShield，能够在传递合法语音指令的同时混淆用户的私人谈话，在不影响VA 响应能力的前提下有效保护用户的私密谈话。Mhaidli 等［48］的研究则将人际交流的凝视方向及音量变化作为增强设备语言隐私性能的手段，即只有当用户对设备发话时，其麦克风或语音识别系统才会被激活。Kepuska 等［49］同样提出一套包括用户语音、手势、触摸、注视以及头部或身体运动的多模态识别系统，协同作用以减少VA 监听用户的日常谈话。

研究者根据用户与VA 的交互模式提出了对用户身份认证方式的改良建议。在分析VA 的语音识别漏洞后提出了连续身份验证系统，以确保仅对合法用户发出的指令进行回应［24，50］。经实验验证，该解决方案能将设备接收到的语音与收集的合法用户的体表振动相关联，大大提高检测准确度，但系统功能依靠可穿戴安全令牌完成。Pradhan 等［51］和Lei 等［52］的解决方案则免于穿戴，其提出的语音检测系统能够根据实时发音与重放语音时人类呼吸模式之间的固有差异实现基于物理存在的访问控制，并利用WiFi 检测出不同类型的外部攻击，在此条件下，只有当附近有人时设备才会启用并接受语音指令。Cheng 等［53］则建议使用保护性干扰装置，一旦识别到语音唤醒词后便会发出干扰信号，以防止VA 被唤醒并对语音信号作出进一步的分析。为应对海豚攻击的隐藏指令，Zhang 等［30］推荐了两种缓解措施，分别为改进扬声器以抑制超声波对源语音的影响，以及在语音捕获子系统中的低通滤波器之前引入一个模块，专门用以识别和消除隐藏语音指令的基带信号。Wang 等［54］则考虑到虽然隐藏指令的音频特征可能会欺骗身份验证系统，但运动传感器捕获的由音频引起的表面振动却很难伪造，因此提出采用低成本运动传感器，同时要求语音指令与声学特征和振动域，为攻击者带来了更艰巨的挑战。以上身份验证方法都可以在一定程度上减少恶意攻击的发生，加大其他用户在未经许可的情况下访问VA 的难度，为用户的隐私安全提供双重保险。鉴于有些认证方法需要额外设备的支持，其实际的用户接受度也值得考证［44］。

对策与优化研究关注VA 第三方服务提供商的云端安全架构，根据对抗性攻击利用系统漏洞的方式提出对应的改进措施。Kumar 等［40］建议对每个新技能的启用指令进行语音和文本分析，检查是否与现有技能重叠，以减轻设备受语音抢注攻击的风险。Zhang 等［38］也针对恶意技能的检测提出了解决方案，新系统会将用户指令与当前正在交互的设备技能进行匹配，通过考虑用户话语与他们当前使用技能之间的联系确定切换意图，减少恶意程序的回应频率。

云存储的保密性能关乎着用户的数据安全，研究者也针对VA 的存储服务提出了改进建议。根据Ford 等［22］研究，仅靠用户定期查看记录以减少恶意攻击只能提供事后分析，存在一定的被动与滞后性，并因此对提供商确保云端的安全组织架构提出了要求。Vecchiato 等［55］针对数据收集与提取过程中的隐私与安全，提出由个人、环境和云三层组成，能够对从传感器和移动设备收集的数据进行情景感知操作的基础通信架构。

总结可知，国外有关VA 语言信息安全威胁的应对研究呈现出明显的技术先导原则，即信息安全建立在技术发展的前提之上，但安全保护研究相对滞后，较少从用户、开发者、第三方等多维主体角度，综合考虑个体、团队、组织和社会对信息安全进行立体、多层次地研究，缺乏根据语言信息安全敏感与风险程度的系统性分析，并将安全防控前瞻性地落实在产品开发阶段。

（4）综述研究。自2014 年针对VA 与个人语言信息安全问题的文章发表以来，国外对该领域研究成果进行系统回顾与反思的综述论文也较为缺乏，共有7 篇，具有代表性的文献来自Bolton、Edu 和Pal等［21，44，56］。前两篇均为梳理已被证实的VA 对用户隐私与安全造成的负面影响以及相应的改进措施，而非对研究主题或已有成果作出全面分析，后者以增强用户对VA 的使用信任为研究视角，梳理了与用户隐私与安全保护有关的利益主体及其详细职责，分类讨论了不同类型的VA 隐私问题，并据此提出了隐私保护信任模型以减轻VA 用户在使用过程中的安全隐患。

2.3.3 研究方法

科学的研究方法是获取可靠结果的前提与基础，决定着研究的有效性。梳理与分析研究方法既可以从宏观上把握国外VA 与用户语言生物信息安全问题研究的理论视角与发展态势，也能为后续研究提供方法借鉴。本文采用信息系统领域内学者广泛采用的Alavi 和Carlson 的分类方法［57］，将研究划分为实证研究和非实证研究。如图4 所示，2014-2021上半年国外VA 与用户语言隐私安全研究大多采用了实证研究方法（43 篇，81.13%），标志该领域逐渐能够以学科视角客观解释并验证假设的合理性，走向发展成熟阶段。

Fig.4 Research methods of foreign research on VA and language bioinformation security from 2014 to June 2021图4 2014-2021上半年国外VA与用户语言信息安全问题研究方法统计

3 述评与展望

3.1 关键趋势

从上述文献梳理结果可知，用户语言隐私与安全保护已成为国际VA 研究中的新兴议题，处于持续发展阶段，表现在文章发表总数不多但增幅较大，研究主题不断拓宽，理论与实证研究的创新成果不断涌现。相比之下，我国的VA 语言安全研究尚处于起步阶段，学者大多探讨VA 的适用场景、应用效果及优化功能的设计与实现，但对与之相关的信息安全问题，尤其是语言生物信息安全问题研究仍停留在介绍阶段。未来实证研究可从以下3 方面着手，深入探究VA 对用户语言隐私安全的影响及优化策略。

3.1.1 开阔研究视角

尽管本领域研究的关注对象主要为用户群体，但国外相关研究选择的用户范围相对宽泛。现有的国内外研究缺少以特定客户，如儿童及家长、商务人士、图书馆读者、教育人士等为受试对象的研究，无法了解其在产品使用过程中遇到的具体语言信息安全问题。未来研究可拓宽研究对象的选取范围，丰富受试对象的多样性和区分度。用户语言隐私安全研究也应更多回应用户的隐私顾虑，探究数据生命周期中各环节涉及的用户个体、企业组织和社会等多层次利益主体及其详细职责［56］，建立用户语言隐私关注与安全使用行为评估指标体系与符合用户隐私关注与感知风险、感知利益作用机制的语言信息保护模式，提升研究成果的科学性、系统性和实用性。

3.1.2 深化研究内容

现阶段国内研究对VA 隐私安全性能问题大多处于介绍阶段，只知其然而不知所以然，很少考虑到设备复杂的全貌架构，尤其对语言生物信息识别、用户身份授权、语音数据安全技术研发与标准制定等方面已暴露问题的实验验证及运行机制研究不足，无法追溯不同安全问题在来源上的相似性，进而针对包括数据产生、传输、使用、分享及消除在内的生命周期各个阶段提出差异化的应对措施，保护策略的理论研究也尚未得出体系化的建议。因此，研究者需要充分考虑不同环境下VA 与用户语言安全问题的多样性，从优化实践出发深入分析产品开发、运行环境、使用风格、第三方介入等因素对用户语言隐私安全造成的潜在威胁，亦或从风险治理为视角，研究如何合理利用大数据技术更加精细、实时地监测信息安全风险，制定语言信息安全风险评估机制，并在此基础上探索有效的信息安全风险规避措施。

云空间通常支持多种远程的数据访问模式，更加剧了其遭受外部攻击的风险。目前，少有研究者关注商家掌握大量语言生物数据后其保密存储性能能否保证用户的数据安全，但其能为用户语音数据的合理使用及语言信息的充分消除提供学界支持，具有较大的现实意义与研究潜力。

此外，国外有关VA 语言信息安全威胁的应对研究呈现出明显的技术先导原则，即信息安全建立在技术发展的前提之上，但较少从用户、开发者、第三方等多维主体角度，对信息安全保护管理进行立体、多层次地研究。国内学者可据此对语言信息安全的敏感与风险程度进行系统分析，并将安全防控前瞻性地落实在产品开发阶段。

3.1.3 调查隐私政策

隐私法规要求开发者必须提供隐私政策，并通知用户运营商在收集哪些信息、如何使用这些信息、正在共享什么信息［57］。第三方开发者提供的多样化隐私政策有可能对用户使用隐私敏感服务造成潜在风险。为此，国内研究者可关注隐私政策与许可信息一致性、语音应用程序的更新是否及时反映在隐私政策、用户如何参与隐私政策以及他们对VA 隐私政策的看法等。相关研究结果有助于开发者的隐私决策、提高隐私政策质量，并为VA 用户提供有效的隐私通知，减少其隐私暴露风险。

3.2 研究方法

近年来，国外VA 与用户语言隐私安全的实证研究多采用解释主义的质性研究范式，研究者通过调查、访谈、实验等方法探究VA 可能存在的隐私安全性能问题及相关用户行为。相比之下，国内在该领域的实证研究十分缺乏，可以通过引进国外较成熟的测量工具或机理框架，在尊重中国法律、政策等特定情境因素的前提下力图得出更多具有概括性的研究结果，也可以考虑在自然情境下运用仿真实验，有效提升研究的信度和效度。

3.3 核心挑战

VA 通过系统编译大量敏感数据集与个人身份信息，可能暴露用户记录在语音通信中的生物信息。为应对此类挑战，设计者和策划者应在设计初期考虑到VA 使用过程中的隐私风险、安全问题及伦理道德。同时，无线连接在增强用户体验的同时，也加剧了与网络可靠性相关的风险。研究者可考虑设计和优化能应用于本地运行的算法，实现本地数据的灵活处理［58］。

为保护用户隐私，针对VA 的国内研究也可考虑借鉴国外相关技术，如基于sm-ALTP（sign modified acoustic local ternary pattern）的SASV（Secure Automatic Speaker Verification）技术、Vocal Tract Length Normalization（VTLN）技术，以期混淆用户语音并删除敏感的语音特征、构建语音隐私保护框架、实现离线处理语音命令，挖掘其应用发展前景。

4 结语

对智能设备VA 与个人生物语言信息安全问题的国际文献进行综述发现，近年来该领域的关注对象主要为广泛的用户群体，研究主题涉及用户行为与意愿、对语言信息安全问题的解释、对策优化及综述研究，较为全面地探究了语音数据全生命周期中可能存在的隐私安全问题，预测了国内该领域未来的关键趋势、核心挑战和研究路径。国外研究样本缺乏多样性，对策与综述研究在以技术视角之余，较少有基于多维责任主体的系统观照。鉴于国内VA与用户语言隐私的研究尚处于起步阶段，期望本研究能为学者提供较为综合的信息参考，秉承问题意识开阔研究视角，从优化用户语言信息的安全保护出发深化研究内容，促进国内成果的进一步涌现。