暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

AI比全人类加起来还聪明?英伟达更像软件平台?欧洲为AI监管定下基调;SAP数据分析重大升级;全同态加密技术融资;数据库融资超亿

225


行业快讯与友商动态 2024年第10期


欧洲通过《人工智能法》,为西方AI监管规则定下基调,有望规范AI监管规范AI应用。


在数据库领域,被诟病最多的国产数据库易鲸捷融资超1亿;在开源的文档数据库上,MongoDB和AWS又干上了。当开源成为一种商业模式时,开源数据库就成为利益争夺点。


NVIDIA GTC成为了全球关注的焦点,除了NVIDIA发布的新GPU和软件外,英伟达竟然宣称自己更像软件平台企业。


与数据平台企业的合作也成为焦点。其中Snowflake与NVIDIA 的合作,进一步为企业客户提供 AI 平台,将全栈NVIDIA加速平台与值得信赖的数据基础和Snowflake数据云的安全AI结合在一起。


本周焦点
1.大语言模型正在重塑政府行业知识应用,星环科技入选IDC《大模型背景下的政府行业知识图谱市场分析》报告
2.英伟达宣称,新发布人工智能芯片Blackwell更像一个平台
3.英伟达首席执行官黄仁勋宣布推出新的人工智能芯片:“我们需要更大的GPU”


大数据
4.SAP数据和分析重大升级,添加GenAI、简化数据环境、直观数据交互、SAP Datasphere平台
5.拓数派发布云原生虚拟数仓PieCloudDB 3.0版本,支撑数据要素可信流通
6.云趣科技自主研发的 Web-based SQL 编辑器QueryX发布,SQL开发更高效,数据访问更安全
7.新一代实时数据集成框架Flink CDC 3.0核心技术公布
8.Apache Doris 2.1.0 版本发布:开箱盲测性能大幅优化,复杂查询性能提升100%
9.Snowflake与NVIDIA合作,为客户提供全栈AI平台
10.BigID率先获得突破性专利,以加速 AI 的数据管理和编目技术


数据库
11.数据库企业易鲸捷获贵州大数据基金投资约1.15亿元
12.革命性转变:MariaDB替代MySQL理想破灭,MySQL 5.7退役引发轰动,替代开源数据库还需看国产数据库崛起
13.为了DocumentDB兼容性,MongoDB和AWS又干上了
14.InfluxData与AWS合作,为开发者提供Amazon Timestream时序数据库托管服务
15.流式数据和历史数据处理统一Timeplus Proton的Rust客户端发布
16.云智慧发布对象关系型数据库CloudPanguDB,打破传统技术壁垒
17.DataStax推出多区域矢量数据支持,使能超低延迟、高可用的GenAI应用


数据安全
18.Zama筹集了7300万美元的资金,以推动全同态加密技术的创新
19.Zscaler以3.5亿美元的价格收购了网络安全数据处理初创公司Avalor


AI
20.易观分析发布了《中国人工智能行业应用发展图谱2023》,AI星环科技入选两大AI应用图谱
21.欧洲议会正式通过《人工智能法》,为整个西方的AI监管规则定下基调
22.马斯克预言,2029年AI可能会比“全人类加起来”更聪明,呼吁对这项强大的技术进行更多监管
23.IBM 宣布在 watsonx 上提供开源的 Mistral AI 模型
24.继微软、Snowflake后,Databricks投资Mistral AI ,并将Mistral AI模型集成到其平台中


本周焦点


1.大语言模型正在重塑政府行业知识应用,星环科技入选IDC《大模型背景下的政府行业知识图谱市场分析》报告


近日,IDC发布《大模型背景下的政府行业知识图谱市场分析,2023》报告,分析了政务知识应用的主要场景及面临的挑战,大语言模型和知识图谱在知识应用市场的作用,未来如何演进。星环科技作为政府行业知识应用主流供应商入选IDC《大模型背景下的政府行业知识图谱市场分析,2023》报告。


报告指出,大语言模型正在重塑政府行业知识应用。大模型的本质是文本生成,基于上下文进行内容扩充,基于已知知识概率最大推测,真实性不能保证。知识图谱的本质是利用结构化的数据提供准确的知识,通过知识图谱保证准确,消除大模型的幻觉。知识图谱能够为通用大模型的行业化应用提供行业领域知识支撑,弥补通用大模型语料里专业领域知识的不足。结合知识图谱的知识关联和大模型的推理生成能力,将解决在具体行业场景落地过程中的准确性、安全性、交互性等多方面的应用要求。


星环科技致力于打造企业级大数据基础软件,围绕数据全生命周期提供基础软件与服务,形成了大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具的软件产品矩阵。星环科技在知识图谱领域深耕多年,有着深厚的技术沉淀和实践经验,同时积极探索大语言模型结合知识图谱在政府知识管理中的应用。


2.英伟达宣称,新发布人工智能芯片Blackwell更像一个平台


英伟达刚刚宣布了用于运行人工智能模型的新一代人工智能芯片(GPU)和软件。


新一代 AI 图形处理器被命名为 Blackwell。第一款Blackwell芯片名为GB200,将于今年晚些时候发货。英伟达正在用更强大的芯片吸引客户,以刺激新订单。例如,公司和软件制造商仍在争先恐后地获得当前一代的“Hopper”H100和类似芯片。


该公司还推出了名为NIM的创收软件,这将使部署AI变得更加容易,这为客户提供了另一个理由,让他们在不断上升的竞争对手领域坚持使用Nvidia芯片。


英伟达高管表示,该公司正不再是GPU芯片提供商,而更像是像Microsoft或苹果这样的平台提供商,其他公司可以在其上构建软件。


因此英伟达CEO黄仁勋说, Blackwell不是一个芯片,它是一个平台的名称。其中可销售的商业产品是GPU,软件都是为了帮助人们以不同的方式使用GPU。但真正改变的是“我们现在真的有了商业软件业务”。


3. 英伟达首席执行官黄仁勋宣布推出新的人工智能芯片:“我们需要更大的GPU”


当地时间3月18日,黄仁勋发表主题演讲《见证AI的变革时刻》。在两个小时的演讲中,黄仁勋围绕五大板块,介绍了英伟达的最新研发进展:新的产业发展、Blackwell平台、创新软件NIMs、AI平台NEMO和AI工坊(AI foundry)服务,以及仿真平台Omniverse和适用于自主移动机器人的Isaac Robotics平台。


Nvidia 每两年更新一次其 GPU 架构,从而实现性能的大幅提升。过去一年发布的许多 AI 模型都是在该公司的 Hopper 架构上训练的——该架构被 H100 等芯片使用——该架构于 2022 年发布。


最新一代AI芯片Blackwell GPU的亮相。这款芯片被命名为B200,计划于今年晚些时候上市。


一个B200 GPU能够从其2080亿个晶体管中提供高达20 petaflops(每秒千万亿次浮点运算)的FP4八精度浮点运算能力。相比之下,英伟达H100芯片所包含的晶体管数量为800亿个,提供4 petaflops的FP4八精度浮点运算能力。


在此基础上,一个GB200加速卡结合了两个B200 GPU和一个独立的Grace CPU,将能够使大模型推理工作负载的性能提升30倍,同时提高效率。相比于H100,它可以“将成本和能源消耗降至1/25”。


这就意味着,以前训练一个拥有1.8万亿参数的模型需要8000个Hopper GPU 和15兆瓦的功耗。而今天,黄仁勋表示,同样的工作只需要2000个Blackwell GPU就能完成,功耗仅为4兆瓦。同时,取决于各种Blackwell设备的内存容量和带宽配置,工作负载的实际性能可能会更高。


大数据


4.SAP数据和分析重大升级,添加GenAI、简化数据环境、直观数据交互、SAP Datasphere平台


SAP宣布多项数据和分析创新,包括添加GenAI功能、简化数据环境、直观数据交互以及 SAP Datasphere平台中将提供的其他几项功能,使组织能够充分利用其数据的力量。


用户现在将能够更直观地与组织的数据进行交互,这将有助于提高运营效率并鼓励更智能的业务转型。


SAP的人工智能辅助驾驶工具将允许用户自动执行数据分析任务,包括访问复杂数据集的新知识图谱和用于更高级GenAI工作负载的矢量数据库功能。


现在,SAP Analytics Cloud 中也提供了 copilot,可用于自动创建报表、仪表板和其他工具。这种自动化将通过 SAP HANA 云的新矢量功能提供,该功能现已正式发布。


SAP Datasphere 和 SAP Analytics Cloud 正在实现更紧密的集成,以实现更好的跨企业规划。这将有助于打破数据孤岛,允许使用单一工具进行数据规划、准备和建模。


这种集成还增加了一个新的“指南针”功能,为用户提供数据模拟功能,以更准确地预测业务成果。SAP Analytics Cloud compass 预览版计划于2024 年第3 季度末推出


知识图谱旨在为 LLM 提供更好的上下文,并最大限度地减少 AI 幻觉,这已成为使用该技术的主要风险。手动创建知识图谱需要大量的精力和成本。但是,SAP Datasphere 通过在 Datasphere 中预先填充相关内容的知识图谱来克服这个问题。(datanami.com


5.拓数派发布云原生虚拟数仓PieCloudDB 3.0版本,支撑数据要素可信流通






https://mp.weixin.qq.com/s/feEY0o0ji_QQryfWoNoesw


3月14日,拓数派发布云原生虚拟数仓PieCloudDB 3.0版本,通过拓数派首创的数仓虚拟化技术,支撑数据要素可信流通,真正实现数据‘可用不可见’,让模型更大更快更准,并达到「数据入库不出户:不跑数据,跑计算」的安全状态。


新一代PieCloudDB元数据管理系统木牍,较之上一代,全新的木牍架构具备全自研、模块化设计和高性能三大产品特性,并接入了简墨存储底座,使得所有存储统一化,进一步释放存算分离的优势,在数据要素流转中发挥更大的价值。


6.云趣科技自主研发的 Web-based SQL 编辑器QueryX发布,SQL开发更高效,数据访问更安全


QueryX 是云趣科技自主研发的 Web-based SQL 编辑器,为数据库用户(尤其开发和运维人员),提供更自主可控的数据库客户端访问工具,凭借增强的授权模式实现更细粒度的数据库对象访问控制,并通过 SQL 审核能力协助 SQL 开发者提升研发效率。


新版本QueryX主要带来 2 点增强:优化 SQL 编辑器,提高了流畅性、兼容性、准确性和灵活性。


提供资产大盘。在QueryX新版本中,基于国家颁布的金融业数据分级指南JR/T 0197-2020以及项目实施中的最佳实践,提炼出金融行业数据资产识别模板,内置 12 个大类,4 个等级,200+ 种数据特征,可以快速识别客户个人基本信息,财产信息,健康生理信息等高价值数据资产。


7.新一代实时数据集成框架Flink CDC 3.0核心技术公布


Flink CDC 是基于数据库日志 CDC(Change Data Capture)技术的实时数据集成框架,配合 Flink 优秀的管道能力和丰富的上下游生态,Flink CDC 可以高效实现海量数据的实时集成。


在社区用户与开发者的共同努力下,Flink CDC 于 2023 年 12 月完成了 3.0 版本[1] 的功能落地,提供了强大的端到端的全增量同步、表结构变更自动同步、整库同步、分库分表同步等高级特性,有效地解决了用户的痛点。


Flink CDC 3.0 的核心特性包括:


·端到端数据集成,用户只需要配置一个 YAML 文件就能快速构建数据入湖入仓作业。


·完整的数据同步,全量读取结束自动同步增量数据,并且上游表结构变更自动应用到下游。


·一个作业实例支持读取和写入多表,占用数据库连接少,增量读取阶段自动关闭空闲读取器,节省计算资源。


8.Apache Doris 2.1.0 版本发布:开箱盲测性能大幅优化,复杂查询性能提升100%


Apache Doris 2.1.0 版本的正式发布。


在查询性能方面,2.1 系列版本着重提升了开箱盲测性能,力争不做调优的情况下取得较好的性能表现,包含了对复杂 SQL 查询性能的进一步提升,在 TPC-DS 1TB 测试数据集上获得超过 100% 的性能提升,查询性能居于业界领先地位。


在数据湖分析场景,进行了大量性能方面的改进、相对于 Trino 和 Spark 分别有 4-6 倍的性能提升,并引入了多 SQL 方言兼容、便于用户可以从原有系统无缝切换至 Apache Doris。在面向数据科学以及其他形式的大规模数据读取场景,我们引入了基于 Arrow Flight 的高速读取接口,数据传输效率提升 100 倍。


在半结构化数据分析场景,引入了全新的 Variant 和 IP 数据类型,完善了一系列分析函数,面向复杂半结构化数据的存储和分析处理更加得心应手。


在 2.1.0 版本中也引入了基于多表的异步物化视图以提升查询性能,支持透明改写加速、自动刷新、外表到内表的物化视图以及物化视图直查,基于这一能力物化视图也可用于数据仓库分层建模、作业调度和数据加工。


在存储方面,引入了自增列、自动分区、MemTable 前移以及服务端攒批的能力,使得大规模数据实时写入的效率更高。


在负载管理方面,进一步完善了Workload Group 资源组的隔离能力,并增加了运行时查看 SQL 资源用量的能力,进一步提升了多负载场景下的稳定性。


9.Snowflake与NVIDIA合作,为客户提供全栈AI平台


3 月 18 日 Snowflake在 NVIDIA GTC 上宣布扩大与 NVIDIA 的合作,进一步为企业客户提供 AI 平台,将全栈 NVIDIA 加速平台与值得信赖的数据基础和 Snowflake 数据云的安全 AI 结合在一起。


在 Snowflake 和 NVIDIA 之前宣布的 NVIDIA NeMo 集成的基础上进行扩展,Snowflake 客户很快将能够直接在其数据云中的专有数据,同时通过 Snowflake 的内置功能无缝维护数据安全、隐私和治理。


NeMo Retriever 增强了聊天机器人应用程序的性能和可扩展性,并可以加快 400+ 企业的价值实现时间,这些企业已经使用 Snowflake Cortex(某些功能可能处于预览阶段)、Snowflake 的完全托管大型语言模型 (LLM) 和矢量搜索服务构建了 AI 应用程序。扩大的合作还将包括 NVIDIA TensorRT 软件的可用性,为深度学习推理应用程序提供低延迟和高吞吐量,以增强基于 LLM 的搜索功能。


NVIDIA 加速计算为 Snowflake 的多款 AI 产品提供支持,包括 Snowpark 容器服务,以及:


·Snowflake Cortex LLM 函数(公共预览版):借助 Snowflake Cortex LLM 函数,具有 SQL 技能的用户可以利用较小的 LLM 在几秒钟内经济高效地处理特定任务,包括情绪分析、翻译和摘要。更高级的用例包括使用 Mistral AI、Meta 等公司的高性能模型在几分钟内开发 AI 应用程序。


·Snowflake Copilot(个人预览版):Snowflake 的 LLM 助手 Snowflake Copilot 使用自然语言将生成式 AI 引入日常 Snowflake 编码任务。用户可以以纯文本形式提出有关其数据的问题、针对相关数据集编写 SQL 查询、优化查询和筛选见解等。


·Document AI(个人预览版):文档 AI 可帮助企业使用 LLM 轻松从文档中提取发票金额或合同条款等内容,并使用可视化界面和自然语言微调结果。客户使用 Document AI 帮助其团队减少手动错误,并通过自动化文档处理提高效率。datanami.com


10.BigID率先获得突破性专利,以加速 AI 的数据管理和编目技术


云和混合云领域领先的数据安全和合规供应商BigID 宣布获得首项基于动态文档聚类和关键字自动识别相似、重复和冗余数据的专利,可显著增强 AI 的数据清理、整理和编目过程。


如今,企业被埋没在大量数据中,其中大部分是重复或不相关的,使分析复杂化并扭曲了人工智能结果。由于典型企业文件共享的巨大规模和复杂性,组织通常难以知道拥有哪些数据,并积累了大量相似、重复和冗余的数据,这些数据可能会导致分析问题、扭曲结果,并导致数据失真和不准确的结果在使用 AI 时。


BigID可自动查明相似、重复和冗余的数据,不仅简化了数据管理并提高了安全性,还通过以下方式为更精确、更安全的 AI 使用铺平了道路:


·自动查找、整理和编目相似数据集


·改善数据卫生,实现更准确的数据分析和 AI 实施。


·简化用于 AI 训练的相似和重复数据的管理。


·加速数据分析并提高数据质量,以实现更准确、更安全的 AI 用例,从而产生更准确的 AI 结果。


·自动处理冗余、过时和琐碎的数据。


·减少攻击面并最大限度地降低数据存储成本。


·通过更简洁的数据帮助实现合规性并加速云迁移。(cioinfluence.com


数据库


11.数据库企业易鲸捷获贵州大数据基金投资约1.15亿元


3月15日晚间,中国软件发布公告-参股的数据库企业易鲸捷获贵州大数据基金投资约1.15亿元。


中国软件投资的信创企业包括3家,麒麟软件(研发国产操作系统已入围信创名录),达梦数据库(国产数据库“老4家”之一,其单机数据库已入围信创名录),易鲸捷(分布式数据库研发企业,目前分布式数据库名录未发布)。


12.革命性转变:MariaDB替代MySQL理想破灭,MySQL 5.7退役引发轰动,替代开源数据库还需看国产数据库崛起


MariaDB公司濒临破产最终可能3700万美元被“私有化”的消息。开源数据库MySQL,因为甲骨文特殊的商业策略也广受诟病。同时其不同版本EOL,也让大量用户苦不堪言!


在某省级社保系统数据库迁移过程中,KunDB仅用了3天,就完成了8万多行PL/SQL代码的迁移工作,高效、低成本、安全地保障了原数据库迁移,实现了数据库系统的国产化替代。


13.为了DocumentDB兼容性,MongoDB和AWS又干上了


最近,MongoDB和AWS又干上了,连续发了两篇文章,直指AWS DocumentDB并不能很好兼容MongoDB,只有33.84%的兼容性。


MongoDB是当前NoSQL领域最成功的开源数据库,是JSON文档数据库的老大,相信很多技术人都知道,开创性探索出了开源+云原生服务的商业模式,公司市值已经260亿美金。


DocumentDB是AWS研发的一个兼容MongoDB的数据库,这个也是AWS对MongoDB修改开源协议的一个反击。


MongoDB希望修改开源协议来推进与云平台的合作,但是海外几大云平台并没有如愿合作,第一家与MongoDB合作是中国的阿里云,MongoDB给阿里云提供最新的代码授权和技术服务,包括MongoDB企业版能力,阿里云可以自由售卖,MongoDB从阿里云的销售成果中获取收益,皆大欢喜。后来MongoDB也与腾讯云平台达成了合作。


14.InfluxData与AWS合作,为开发者提供Amazon Timestream时序数据库托管服务



领先的时间序列平台 InfluxDB 的创建者 InfluxData 正在与AWS合作,提供Amazon Timestream,使用户能够利用 AWS 的可扩展性、可靠性和安全性在托管基础设施上快速构建和运行时间序列应用,而无需自行管理的开销。


将 InfluxDB 作为首选的 AWS 时间序列数据库意味着 InfluxData 的类别领导地位和时间序列数据库的高增长市场,为实时分析和人工智能训练模型提供动力。通过使用 InfluxData,AWS 开发人员现在可以在 AWS 管理控制台中通过简单的方法来管理和从时间序列数据中获取价值。(dbta.com


15.流式数据和历史数据处理统一Timeplus Proton的Rust客户端发布


一家专门将计算因果关系应用于金融市场的金融科技研究公司Emet-Labs研发总监Marvin Hansen为时序数据库Timeplus Proton开发了一个Rust客户端,现在已经公开发布


Timeplus Proton是一个全新的聚合数据解决方案,能够将流式数据和历史数据处理统一起来。它已经为实时市场数据流或交易后分析提供了蓝图解决方案,并支持实时机器学习。


Proton是融合了ClickHouse的技术上建立的,这意味着可以借助现有的ClickHouse客户端来开始工作。很幸运,能够通过封装现有的ClickHouse Rust客户端(https://crates.io/crates/clickhouse),创建了Proton的第一个Rust客户端(https://crates.io/crates/proton_client)。由于新的Rust Proton客户端包装了底层的ClickHouse客户端,因此如果你需要对Proton客户端尚未覆盖的特定操作进行更精准的访问,仍然可以使用它。


16.云智慧发布对象关系型数据库CloudPanguDB,打破传统技术壁垒



云智慧推出关系型数据库CloudPanguDB(中文名称:盘古数据库),旨在通过高兼容性能和创新技术架构,降低企业项目整体运营成本。


CloudPanguDB以云智慧自身产品技术为基础,统一优化技术架构,功能覆盖关系型数据库、全文搜索引擎、图数据库等应用场景。有效兼容PostgreSQL,高度满足企业数据库应用需求,助力企业降低前期项目部署的软硬件成本,以及后续项目维护的各项资源成本。


相较于传统的数据库,CloudPanguDB作为一款功能强大的开源对象关系型数据库系统,支持丰富的数据类型,包含数值、字符串、时间日期等基本数据类型,JSON、XML、几何等文档数据类型以及自定义类型。此外,C/C++、Python、Java、Ruby、Perl等多种可编程接口,有效提高企业各类业务需求开发效率。


17.DataStax推出多区域矢量数据支持,使能超低延迟、高可用的GenAI应用


GenAI 数据公司 DataStax 今宣布在 DataStax Astra DB 中支持多区域矢量数据。随着多区域支持的推出,用户可以将相关数据放在正确的位置,以最大限度地提高响应能力,同时为其 GenAI 应用程序提供高可用性。


除了准确性和相关性之外,速度是GenAI应用程序的主要要求,因为缓慢的响应时间会导致糟糕的用户体验。多区域矢量可用性使矢量数据更接近最终用户,从而减少延迟并提供实时响应。客户还可以从简化GenAI应用程序测试和验证流程中受益,并能够有效地将暂存环境复制到不同的区域,从而允许在地理上不同的环境中进行全面测试。这也有利于管理不断增长的需求,而不会随着用户数据量的增长而牺牲性能或可用性。datanami.com


数据安全


18.Zama筹集了7300万美元的资金,以推动全同态加密技术的创新


开源密码学公司 Zama 在 A 轮融资中筹集了 7300 万美元,本轮股权融资使 Zama 的总融资额超过 8000 万美元。


该大型融资在过去两年中分两批执行,旨在支持 Zama 推进其全同态加密(FHE)工具的研究和开发。此外,随着新资金的获得,Zama打算在未来几个月内扩大其团队并增强其业务和生态系统。


Zama 利用 FHE 技术使公司能够向用户提供服务,而无需访问他们的数据并将其暴露在更高的风险中。该公司的最新产品fhEVM是一种机密的智能合约协议,专为与以太坊兼容的区块链而设计。该协议确保链上数据在整个处理过程中保持端到端加密。fhEVM 目前与以太坊虚拟机 (EVM) 区块链兼容。


从最初的研究阶段开始,Zama 的性能就取得了 100 倍的显着提升。该公司正在积极寻求将性能再提高 1,000 倍,以支持更大的应用程序。(mpost.io


19.Zscaler以3.5亿美元的价格收购了网络安全数据处理初创公司Avalor


Zscaler收购一家帮助公司分析其网络安全工具生成的漏洞数据的初创公司Avalor Technologies。


总部位于加利福尼亚州的 Zscaler 是一家网络安全软件提供商,在全球拥有 5,000 多家客户。该公司的产品帮助企业确保其内部数据以安全的方式存储,管理员工对应用程序的访问并执行相关任务。Zscaler 上个季度的收入达到 5.25 亿美元,同比增长 35%。


Avalor是一家总部位于美国纽约和以色列特拉维夫的初创公司,在本周收购之前筹集了3000万美元。其旗舰产品是一个名为Data Fabric for Security的分析平台。该平台可以汇总公司其他网络安全工具生成的数据,如有关软件漏洞的信息,并使其更易于理解。


大型企业使用数十种网络安全产品。因此,在某些情况下,多个产品检测到相同的漏洞并生成重复的警报。Avalor 的平台可以将重复的警报压缩到单个项目中,以简化分析,并添加上下文详细信息,例如有关哪些业务部门受漏洞影响的数据。


Data Fabric for Security 还执行其他任务,可以按严重性对网络安全问题进行优先级排序,并在仪表板中可视化有关每个漏洞的关键详细信息。如果管理员需要给定仪表板中未包含的信息,则可以使用内置查询引擎来检索其他数据。(siliconangle.com



AI


20.易观分析发布了《中国人工智能行业应用发展图谱2023》,AI星环科技入选两大AI应用图谱


https://mp.weixin.qq.com/s/yEFEVWgndskgJAAIQ8YUog


易观分析发布了《中国人工智能行业应用发展图谱2023》,对主要行业AI应用发展背景、关键价值与挑战,以及典型案例进行深入分析,全面展开产业AI智能化全景。星环科技凭借在大数据和人工智能领域的技术优势和实践积累,持续赋能千行百业,此次成功入选“数字政府AI应用图谱”和“金融行业AI应用图谱”两大图谱。


在大模型领域,星环科技也发布了一系列工具产品供用户使用。工具链方面,发布了大模型外挂存储分布式向量数据库Hippo、大模型预训练微调工具Sophon LLMOps及自动化知识库构建工具TKS。预训练大模型方面,发布了金融大模型星环无涯(Infinity)和数据分析大模型星环求索(SoLar)。用户可以通过星环科技自动化知识工程、多模态数据处理等技术,有效降低企业构建自有大模型应用的门槛。


目前星环科技大模型产品已经在政府、金融、运营商、制造、能源等多个行业有诸多落地案例。星环科技凭借全栈基础软件产品,助力众多行业成功实现了数智化转型。


21.欧洲议会正式通过《人工智能法》,为整个西方的AI监管规则定下基调


https://mp.weixin.qq.com/s/BoeT81UOybTevsx4ljQJNA


当地时间3月13日,欧洲议会正式通过了《人工智能法》(AI Act),使得欧盟在对这项颠覆性技术的监管方面走在了世界前列,很可能会为整个西方的AI监管规则定下基调。


欧洲议会表示,《人工智能法》旨在保护基本权利、民主、法治和环境可持续性不受高风险人工智能的影响,同时促进创新,使欧洲成为该领域的领导者。该法规根据人工智能的潜在风险和影响程度为人工智能规定了义务。


接下来,该法案还需要得到欧盟理事会的正式批准,使之成为法律。不过,最艰难的立法阶段已经过去,距离最终出台仅剩一步之遥了。


预计《人工智能法》将于明年初生效,并于2026年正式实施,不过其中一些条款将提前生效。


22.马斯克预言,2029年AI可能会比“全人类加起来”更聪明,呼吁对这项强大的技术进行更多监管


一位著名的未来学家雷·库兹韦尔(Ray Kurzweil)在播客中预测,人工智能(AI)将在2029年之前实现人类水平的智能,但亿万富翁和科技大亨埃隆·马斯克(Elon Musk)声称这将在明年实现。


“明年,人工智能可能会比任何一个人类都聪明,”马斯克在X上发帖说,“到2029年,人工智能可能比所有人类加起来还要聪明。”


马斯克一直直言不讳地表达了他对人工智能及其相关危险的担忧,经常呼吁对这项强大的技术进行更多监管。


他表示担心,如果管理不善,人工智能可能会导致“文明毁灭”。


“即使你说人工智能没有代理权,人们很可能会在选举中使用人工智能作为工具,”他在之前接受采访时说。“如果人工智能足够聪明,他们是在使用工具,还是工具在使用它们?所以我认为事情变得越来越奇怪。”


“正在发生的事情是,他们正在训练人工智能撒谎。这很糟糕。”他补充道。“人工智能比管理不善的飞机设计或生产维护或糟糕的汽车生产更危险。从某种意义上说,它有潜力,无论人们认为这种可能性有多小,但它是非平凡的,它有毁灭文明的潜力。”(今日头条)


23.IBM 宣布在 watsonx 上提供开源的 Mistral AI 模型


https://mp.weixin.qq.com/s/MNnSjGo20-_WoZ_WEwgArg


IBM宣布,由 Mistral AI 公司开发的广受欢迎的开源 Mixtral-8x7B 大型语言模型(LLM)已经可在其 watsonx 人工智能与数据平台上使用。


IBM 提供了 Mixtral-8x7B 的优化版本,在内部测试中,与常规模型相比,该版本能够将吞吐量(即在给定时间段内可处理的数据量)提高 50%,可以将时间延迟减少 35-75%,从而加快获得洞察的时间,具体取决于批处理量的大小。这是通过一个称为量化的过程来实现的,该过程减少了 LLM 的模型大小和内存需求,进而可以加快处理速度,有助于降低成本和能耗。


Mixtral-8x7B 的加入扩展了 IBM 的开放、多模型战略,随时随地满足客户的需求,并为他们提供选择和灵活性,使其可以跨业务来扩展其企业级人工智能解决方案。通过数十年的人工智能研发、与 Meta 和 Hugging Face 开放式协作,以及与模型领导者的合作伙伴关系,IBM 正在扩展其 watsonx.ai 模型目录,并引入新的功能、语言和模式。


IBM 的企业就绪基础模型选择及其 watsonx 人工智能和数据平台可帮助客户利用生成式人工智能获得新的洞察力和效率,并基于信任原则创建新的业务模式。IBM 可帮助客户根据所针对的业务领域(如金融)的合适用例及性价比目标来选择合适的模型。


24.继微软、Snowflake后,Databricks投资Mistral AI ,并将Mistral AI模型集成到其平台中


数据智能公司 Databricks 宣布,已与法国生成式 AI 初创公司 Mistral AI 建立合作关系,并参与了其 A 轮融资。


Mistral AI 已筹得超过 5.05 亿欧元资金,其中绝大部分是在其第一年商业运营期间筹集的。目前,Databricks 与 Mistral AI 合作,将 Mistral AI 的开放模型原生地整合到 Databricks 数据智能平台中。


Databricks 的客户现在可以在 Databricks Marketplace 上找到并使用 Mistral AI 的模型,在 Mosaic AI Playground 中与这些模型互动,通过 Mosaic AI 模型服务以优化的方式部署这些模型,并且还可以通过适配功能,使用自己的数据定制这些模型。


通过这一策略,Databricks 紧随微软和 Snowflake,加入到与 Mistral AI 的合作中,这两家公司最近也与这家 2023 年 4 月成立的初创公司建立了包括技术整合和投资在内的伙伴关系。


微软在 2 月 26 日宣布了与 Mistral AI 的合作和技术整合,并投资了 1620 万美元。紧接着,在 3 月 5 日,Snowflake 也宣布了一项包含未公开投资额的合作和技术整合。


与 Snowflake 一样,Databricks 也没有公开其对 Mistral AI 的投资额。(analyticsindiamag.com

2024预期目标




END



文章转载自Hadoop大数据应用,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论