

随着人工智能(AI)已经成为推动商业创新和市场变革的重要驱动力,数据标注作为机器学习的基石,已经成为 AI 应用的核心环节。然而,数据标注所面临的例如标注质量标准一致性、大规模数据处理加工、专业领域数据标注需求等挑战也不容忽视。打造高质量的数据标注服务,逐渐成为推动 AI 发展新趋势。
其中,作为具有丰富 AI 算法积累的创始团队,主要成员由香港中文大学深圳未来智联网络研究院院士、教授和博士组成的 PublicAI Team,通过将数据加工和 Web 3.0 的分布式经济模型进行融合,加速大规模智能化应用的落地,同时致力让每一个人都能公平透明和自由地参与训练数据加工,并获得应有的劳动报酬。

如何实现隐私保护与分布式工作模式的兼顾?

随着 AI 向医疗、自动驾驶、农业等细分行业的影响不断扩大,AI 已经逐渐进入实际的生产环境,正在替代辅助人类越来越多的日常工作和判断。故细分专业领域的数据标注需求日益提升,所以更专业化的数据识别和标注需要更加具有相关专业背景的人才参与 AI 数据的训练。吸引更多的专业人士加入到数据标注领域并实现全球化协作迫在眉睫。
“未来80%的公司都需要 AI 辅助参与业务的落地,就意味着大量公司需要 AI 本地化的部署和专属定制化的数据训练,培养高度专业化的 AI 来为公司创造价值,这里面必然需要专业人士参与的高度定制化垂直的数据标注。” PublicAI CEO Steven Wong 谈到,“在这样的大背景下,我们推出了 PublicAI 分布式 AI 数据服务,这是一个将 Web 3.0 与机器学习融合的平台,分布在全球各地的垂直领域专业人士可通过贡献自己的知识获得奖励令牌,而这些专业人员的经验也能够进入到我们自主研发的数据标注机器学习模型,为相关行业提供 AI 支持的数据标注能力。”

加入云创计划,
构建 AI 数据隐私沙盒服务企业客户

要打造一个全球化的 Web 3.0 与 AI 结合的数据标注服务,PublicAI 需要可靠的云服务提供商提供从底层算力、安全到可信执行环境的一系列支持。在经过评估后,PublicAI 选择加入亚马逊云科技针对初创企业所推出的云创计划,借助一系列起步云资源和专业的技术与支持服务,将分布式劳动力 AI 数据服务的业务构想变为现实:
● 在实现安全的 Web 3.0 底层服务方面,PublicAI 采用 Amazon Elastic Compute Cloud (Amazon EC2)、Amazon Simple Storage Service (Amazon S3) 等服务,同时标注数据集在 Amazon S3 上存储,实现服务器端加密,以及99.999999999%的数据持久性保障;使用 Amazon Rekognition、Amazon SageMaker 提供的机器学习能力加速模型训练与数据标注,并结合 Amazon WAF、Amazon Shield Standard 提供的安全能力抵御来自第三方的恶意流量与攻击,为分布式 AI 数据标注服务的平稳运行提供保护。
● 在 AI 驱动的数据标注场景中,PublicAI 充分利用 Amazon Rekognition 的机器学习能力,实现部分图像的自动识别和分析,从而快速筛选标注内容,过滤不安全、不适宜或有害的信息,并结合预先训练的模型,实现 AI 驱动的自定义标签标记,辅助标注员在标注任务中可以专注于特定行业内容,提高数据标注效率。
● 在机器学习驱动数据标注方面,PublicAI 将 Amazon SageMaker 托管机器学习服务引入数据标注业务,以创建高质量的训练数据集,同时满足数据安全、隐私和合规的需求。

赢得信赖,提升30%的客源
并为客户节省45%的成本

在亚马逊云科技技术团队的协助下,PublicAI 成功构建了基于云托管服务的分布式劳动力 AI 数据标注服务。这一服务巧妙结合了 AI 与 Web 3.0 的优势,改变了传统的众包数据标注方式,迅速赢得了行业客户的认可。
◆ 亚马逊云科技云创计划的支持加速了 PublicAI 的业务发展,同时协助行业客户优化数据标注成本。采用 Amazon SageMaker 托管机器学习服务,PublicAI 实现更快的速度和训练效率并节省近70%的计算成本,使其能够将更多资金用于提升平台的支持性和服务成熟度。结合亚马逊云科技的成本效益服务和 Web 3.0 众包模式,PublicAI 成功提供了比传统模式低45%的服务报价,使行业客户以更低的价格获得更多的业务价值。
◆ PublicAI 通过将业务应用放置在 Elastic Load Balancing,实现了弹性的流量分发并借助 Amazon Shield Standard 来抵御网络层和传输层的 DDoS 威胁。同时在数据隐私安全方面,在 Amazon Identity and Access Management 中设置精细化的权限,用预防性防护机制建立数据边界,并利用 Nitro Enclaves 隐私计算技术保护用户数据,让更多的行业客户能够信赖 PublicAI。
PublicAI CEO Steven Wong 指出:“Amazon Nitro Enclaves 让我们可以在 PublicAI 上设置多方隐私计算和存储,这意味着平台无需分别给每个参与方披露或共享实际数据,包括众包团队在内的参与方能够以安全的方式加入到项目中并处理一些高度敏感的数据,并将数据保持在隐私计算环境中。隐私计算模式的引入提升了医疗保健与金融服务等行业客户对于 PublicAI 的信心,也为我们带来了更多的客户,实现了超过30%的客群数量增长。”

展望未来,PublicAI 计划加入亚马逊云科技合作伙伴网络(APN),将基于 Web 3.0 与 AI 的数据标注和处理服务提供给更多行业用户,通过亚马逊云科技 Marketplace 拓展全球广泛的服务群体,推动 AI 在更多行业中的创新实现。
关于 PublicAI

PublicAI 是一个基于 Web 3.0 的数据基础设施,致力于将 Web 3.0 的分布式、去中心化的经济激励机制与 AI 模型训练进行融合。AI 训练通常需要大量人类训练师加工过的数据集。目前人工智能研究者是通过传统中心化的数据加工公司提供服务,如 Scale AI。PublicAI 为了满足未来垂直领域 AI 大模型和微调等对垂类专精技能训练师人才需求,借助区块链建立了一个可信高效的数据加工分布式全球协作网络,并通过打通全球范围内的支付,训练师可以通过完成数据标注任务获得令牌悬赏。PublicAI 在为 AI 研究机构大幅降低数据标注成本的同时,提升了训练师的劳动收入。团队成员包括多位国家级院士,IEEE Fellow,斯坦福等顶尖学府的教授和已毕业的博士,及前高盛和 JP Morgan 的资深员工,已与多家头部 AI 研究机构进行合作,并完成交付部分商业订单。

马上点击“阅读原文”
即刻报名亚马逊云科技2023 re:Invent
让我们共同见证亚马逊的一小步
云计算的一大步





