Select Language

AI社区

数据要素产业

理想与现实的努力平衡: OpenAI开启测试API试水商业化道路

OpenAI是一家以追求通用人工智能为目标的研究机构,为AI研究和社区提供了一系列高性能的研究成果和开源模型。其使命在于构建出高度自主并在大多数工作岗位上达到或者超过人类的表现,为人类提供安全、共赢的人工智能系统。

但纯粹的研究理想也需要负担庞大的科研开销,为了平衡使命和现实,OpenAI开始尝试将研发出的高性能算法GPT-3构建成API以实现商业化,以反哺消耗巨大的研究,同时促进算法和研究的进一步迭代改进。

基于这一强大的自然语言模型,OpenAI发布了一款通用的文本处理接口,与先前为特定目标设计的AI系统不同的是,此API可以允许用户任务尝试任意英文语言任务。研究人员和开发者可以利用它构建更为优秀的产品或者更具智能化水平的应用,同时还能为探索这一技术的优点和局限做出贡献。目前已经有十多个公司利用这一API在语义搜索、聊天机器人、客户服务、文本生成、生产力工具和内容补全等方面开发了一系列有效的产品。

在强大的语言模型下,API可以实现对于输入文本信息模式的有效学习和处理。用户可以用少数几个样本对模型进行“编程”,使它按照你的方式来回答问题。下图中显示了调用API的一个样例,可以看到在提供了一个问答样本后(红框中),模型可以根据问答样例的语言模式回答新的问题(蓝色)。模型不仅可以实现问答任务,还显示出了其中已经涵盖了非常丰富的语料和知识信息。

用户可以按照这种方式对模型进行定制化的打磨,一方面通过数据集(大数据或者是少量数据)对模型进行调优训练,另一方面也可以通过人机交互的反馈来对模型的输出进行改进。

此API同时兼顾了易用性和灵活性,一方面可以让任何人都有接入最前沿人工智能技术的简单方式,同时也为研究人员提供了增加生产力的灵活方式,使得团队可以集中精力处理机器学习的核心问题。目前支持该API的是最新的GPT-3模型,GPT-3是OpenAI最近发布的非常强大的自然语言处理模型,完整模型包含了175 billion的参数。下表显示了GPT-3相关模型的架构和参数量。

机器学习领域的发展一日千里,所以背后所支撑的处理流程和模型也在不断迭代和更新。下面几个小视频展示了如何应用这一API到用户的日常工作生活中,以此来解决问题并提高生产力。

针对电子表格的制作,Tabulate插件提供了结构化的表格生成方案。用户仅仅需要输入想要制表的主体,模型就能生成比较理想的表头。在少量的修改后,选择填充表格模型就能从已有知识中填充出内容。这一例子中显示了公司名称、代码和上市的年份。为了聚焦互联网公司,只需要输入两个互联网公司的名字,模型就能找到相关内内容进行填充,还能按照创立年份排序。此外还能够从非结构文本中对文本信息进行结构化填充!突然感觉以后不用做excel了

第二个例子是利用模型对网页内容进行语义搜索。比如你打开了一个wiki百科页面来寻找答案,现在再也不需要一字一句读完整篇文章了,只需要利用网页插件输出你想要问的问题,模型就能根据语义搜索到页面中对应的段落,不仅解答了你的疑问还能对文本位置进行定位,大幅度地提高了资料检索的效率。

下面的例子完整地展示了如何构建个性化的应用,通过简单的linux指令和对应含义的描述,就能构建出一条语义操作模型。直接输出各种口语化表达模型,就能生成对应的命令和命令组合来实现你想要的结果。这个例子中,我们看到了API将人机交互简化到了何种程度,极大地减少了初学者的学习成本、提高了使用者的利用效率,看来用自然语言和计算机交互的时代已经非常近了。

但技术的进步是一把双刃剑,在大规模应用的同时也需要避免恶意使用。API在源头已经切断了一系列明显的恶意应用,包括骚扰、垃圾邮件、激进言论和病毒营销等,但想要穷尽所有可能的恶意应用是不可能的,除了产品开发者的把控,更需要社区的努力。开发者可以探索控制API返回恶意内容的工具,研究人员需要在语言模型的安全方面进行更加深入的研究(包括对于有害偏见的分析检测、缓和与阻断等等)。

理想与现实的道路

OpenAI创立之初拥有满满的情怀,但要持续进行高质量的研究并长久运营下去需要平衡好理想与现实的微妙关系。为了回应舆论对于这次商业化的尝试,OpenAI在官网上从各个方面对这次的API发布进行了回应:

1. 是什么原因促使OpenAI决定发布商业化产品?OpenAI的使命是确保人工智能造福人类,产品的商业化是确保实现目标的有效手段之一。安全地开发一套强大的AI系统是十分困难的,OpenAI希望API的发布可以加强合作,携手解决AI系统在真实世界中所面临的挑战,同时也为未来的研究提供了更多方向性的指导,更好地保证AI系统安全地服务全人类。

2. 为何选择发布API而不是完整的开源模型?

主要有三个原因。首先,商业化可以覆盖AI研究、安全性和政策倡导的成本开支。其次,API后面的模型往往十分庞大,需要耗费大量的人力物力进行训练开发和部署,个人或者中小企业无法负担如此庞大的研发与运营成本。所以API的发布为中小企业和开发者提供了接入强大AI系统的能力。此外,API方式可以对技术的滥用进行更快的应对。一方面有限制的逐步开放API可以在一定程度上控制对于技术的滥用,也可以有效管控;另一方面也不像模型会面临未知的下游应用开发风险,如果开源的模型被恶意使用将很难有效阻止。

3. 针对有可能的API滥用,OpenAI将要如何解决这一问题?一方面将阻断有害身心健康的API调用,包含但不限于骚扰、欺诈、垃圾邮件、激进言论和病毒营销等,并在运营中进一步优化和细化对于API的管理。同时也将引导研究人员加强对于模型潜在滥用的研究,通过学术服务合作与第三方研究机构紧密合作。目前通过审核来开放的beta测试API也将进一步减小API被滥用的风险,并帮助OpenAI更深入地理解API的内涵和局限性。

4. 如何缓和API后台模型所包含的有害的偏见和负面影响?

对于减少像有害偏见这样负面影响,是目前对于整个工业界都是十分重要但困难的问题。事实上API后台所支撑的GPT-3模型在某些情况下也会显示出偏见,所以为了解决这一问题,我们将在以下三个方面进行努力:

一方面给出使用指南,引导用户学习并减小这种偏见的影响;另一方面与用户紧密合作来理解具体业务场景中的问题,并开发工具来标记和干预有害偏见的表现;最后引导更多研究人员对底层的机理和理论进行研究,更广泛深入地理解模型的表达和公平性的影响,协助用户解决问题。在这一过程中对API的优劣进行更为深入地理解,并不断改进工具和工作流程来最大程度地减小负面影响。

最后,让我们再来康康基于API的有趣应用吧:

智能客服

文本生成

文本补全

语言翻译

如果你也想要利用这个API开发自己惊艳的产品,可以到这里提交申请:

Apply link: https://beta.openai.com/?app=customer-service

GPT-3 paper: https://arxiv.org/pdf/2005.14165.pdf

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

将门创新服务专注于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。

将门技术社群专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。

将门创投基金专注于投资通过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括机器智能、物联网、自然人机交互、企业计算。在近四年的时间里,将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、宽拓科技、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。