可信赖的人工智能
可信赖的人工智能——建立正确的基础
《欧盟人工智能法》已于 2024 年 8 月 1 日生效,这是人工智能监管的新曙光。对于那些使用或开发尖端分析解决方案的人来说,很容易认为它们是“低风险”的,因此不需要受到监管。然而,确保合乎道德的技术是分析提供商的首要责任。这不是什么崇高的哲学,而是严格遵守行为准则,以便人们建立对人工智能的信任和信心。
为可信赖的人工智能制定准则
LexisNexis 的母公司 RELX 集团对可信赖的人工智能制定了严格的指导方针,并说明了需要设定的标准:
- 考虑解决方案对人们的实际影响
- 采取行动,防止产生或强化不公平的偏见
- 解释您的解决方案如何发挥作用
- 通过人的监督建立问责制
- 尊重隐私,倡导健全的数据管理
来源:RELX 集团《可信赖的人工智能原则》,2022 年 6 月
就知识产权分析而言,这些指导方针意味着什么?
让我们依次来看看:
对现实世界的影响:IP 分析的主要目的是利用经过整理的可信数据为决策提供支持。分析工具的研发人员不仅要问什么是可能的,能包含多少人工智能,更要问为什么。解决方案是否解决了现实世界中的问题:这意味着倾听和理解客户问题的本质。
偏见:偏见的主流产生因素是基于性别、种族、社会经济地位和其他个人特征,为个人或群体带来较差的分析结果。 但这太局限了。当今专利分析领域的大部分人工智能都是由监督式机器学习或生成式人工智能驱动的,这两种技术都需要训练数据(对于生成式人工智能而言,需要大量的训练数据)。考虑一种精确度和召回率都非常高的分类算法。现在,让一个人参考由一小部分人所拥有的专利或有限地域的专利来训练它。可想而知的是,这必然会导致不必要的偏差。想象一下,一个专利撰写工具的训练集在 Covid 之前。由于视野有限,可能会产生误导性结果。这些问题让分析提供商彻夜难眠。请您务必避开那些没有能力提出其是如何避免系统性偏差的冒牌货。
可解释性:在布尔代数是专利检索的主流方法的时代,生活很容易。检索结果包括包含用户输入的单词(或单词组合)或代码(如 CPC/IPC)的专利。尽管检索结果往往不尽人意,但好在可以解释。
在人工智能发展初期,批评者常抱怨人工智能是一个“黑匣子”,且仅凭这一点就对其嗤之以鼻。如今,在 GenAI 时代,这种程度的恐惧、不确定性和怀疑在很大程度上已经消散(并非因为 GenAI 变得可解释了!)。然而,这并不意味着对透明度的需求有所降低。人工智能提供商应当愿意公开其系统的运作方式,以及人工智能在技术栈中究竟承担了哪些工作。
LexisNexis Classification(前身为 Cipher)是最早的人工智能分类平台之一,我们对其进行了独立测试,并提交了同行评审论文作为证据。至少,客户不应该费尽心思去了解发生了什么。也许最重要的是,必须有透明、可解释的测试来验证准确性。当一个解决方案比下一个最佳替代方案更好、更快、更便宜时,客户关心的是了解系统是如何运行的。
监督与问责:媒体不乏对卫星导航用户因未注意渡口标志而驾车入海的报道,或者无助的律师在法庭辩护状中提交了带有虚假引文的 ChatGPT 输出结果。我们认为,关键是要在提供分析的人和用户之间取得平衡。GenAI 的发展还处于早期阶段,这意味着提供商必须付出更多努力与客户沟通,并对客户进行培训。请记住,GenAI 的训练目的是提供可信的结果。用拟人化的术语来说,GenAI 驱动的系统经过训练,即使在没有答案的情况下也会给出答案。因为它不喜欢让人失望。必须再次强调,这种“幻觉”能力不应妨碍人们的参与。将人工智能视为辅助智能或增强智能,或许可能根本就不是智能。
隐私和数据管理:知识产权领域的许多分析用户都是律师。这意味着,不侵犯他人权利的义务高于正在讨论的原则。服务于这一市场的供应商必须对这一点有清晰的认知。当大型语言模型的基础受到著作权和其他方面的挑战时,这一点就很难做到。这种合理的担忧可能会阻碍语言模型的采用。必须制定法律框架来支持人们采纳这些工具,以应对人们在这方面的担忧。
最佳做法在不断变化
在过去十年中,人工智能对专利分析产生了巨大影响。专利所有者及其顾问指出,人工智能对一系列商业决策产生了显著的影响。这包括专利组合优化、许可和诉讼。可信赖的人工智能是所有分析提供商的指路明灯。以下是我们从客户案例中总结出的经验:
团队合作:将可信赖的人工智能定位为纯粹的供应商责任会削弱用户肩上的责任。处理专利的人面临着创新的压力,需要用更少的资源实现更多的目标。实现这些目标并非毫无风险—但这没有关系。所需要的是多方利益相关者的参与,包括法律、研发和财务部门的其他人员。这样,知识产权部门就能学习其他业务领域的经验。商业情报几乎是所有基于证据的决策的通用燃料。
铁三角:在寻找新方法时,人们通常希望寻找更好、更快、更便宜的解决方案,并对三者中的两个做出妥协。技巧在于能够在正确的时间和正确的地点做出妥协。举个最简单的例子,当您使用离岸资源进行专利检索,成本为 5000 美元/一周,准确率达到 90%。现在,当我们将其与人工智能的专利全景分析进行比较,后者能在 5 分钟内达到 80% 的准确率(而这只是成本的一小部分)。然而,至于您是否应采用这种解决方案需取决于具体情况,而不是追求完美。
把握内幕:市场是混乱的,每个问题都有新的解决方案。然而,当您仅关注那些能带来最大价值的解决方案(这完全是一种主观评估),通常您会发现有前景的解决方案数量有限。其中一些方案的采用时机已经成熟,另一些则发展势头良好。在这两种情况下,都要确保您已占据一席之地。处于人工智能前沿的分析提供商欢迎业界的支持。反之,那些自以为掌握了所有答案的提供商通常则不会这样做。
人们对人工智能的广泛应用深感担忧,这导致全球范围内的监管力度不断加大。然而,在技术快速进步的时代,自我监管往往是最好的途径,也是值得鼓励的。这意味着各组织必须制定、维护和宣传道德与责任原则,这些原则既要清晰明确,让人有信心,同时又要足够灵活,以适应不断发展的人工智能世界。
About Nigel
Nigel Swycher is co-founder and CEO of LexisNexis Cipher – His background is in law, where he led the IP practice at leading law firm Slaughter and May.
Nigel has been recognized for many years by the IAM 300 as a leader in the field of IP strategy.