在生成式人工智能(GenAI)领域,Snowflake 迈出了虽晚但迈出的一大步。凭借 Snowpark 容器服务、Snowflake Cortex 和 Snowflake 自己的大型语言模型 (LLM)“Arctic”等服务,Snowflake 希望在生成式 AI 领域占据一席之地。博客文章的第二部分涉及这三种服务以及它们带来的机会(对于公司而言)。
Snowflake 提供哪些选项?
图 1:GenAI 的 Snowflake 概述,来源
无服务器 AI 和 LLM 功能
与 Snowflake ML 函数相关的是 Cortex 函数。这些现在 室内设计师电子邮件列表 包括 ML 函数和即用型 GenAI 函数。 Cortex 服务已在 Snowday 2023 上推出,旨在简化所有用户对 ML、GenAI 和 LLM 的访问和使用,无论其技术知识如何。尽管许多功能将逐步发布,但该服务现在提供了一个完全托管的环境,使用户可以立即访问越来越多的无服务器功能。使用 SQL 或 Python 与 Snowpark 可以访问专门用于下游 NLP 任务的 LLM 模型:
提取答案,
情绪分析,
文字摘要,
翻译和
嵌入文本。
图2:Snowpark容器服务概述,来源
为了为几乎所有编程语言、框架和库以及所选硬件(CPU/GPU)提供更大的灵活性,Snowflake 开发了“Snowpark 容器服务”。该服务于去年年底推出,提供增强的 Snowpark 运行时,可以快速访问 GPU 基础设施,而无需额外的运营成本。后者是与 NVIDIA 合作的成果。
Snowpark 容器服务使开发人员能够高效、安全地部署容器,从而支持以下自定义 AI 使用案例等:
LLM微调
开源矢量数据库部署
分布式嵌入处理
语音转文本处理
托管推理过程
在幕后,容器服务使用基于 Kubernetes(简称 K8s)的系统来自动管理 Snowflake 生态系统中容器的创建、管理和大小调整。根据 The Stack 的报告,使用的是托管 Kubernetes 集群。这使得用户和公司能够在靠近数据的地方运行应用程序,并从平台的安全机制中受益,而不必担心底层基础设施。
Snowflake自己的大语言模型
Snowflake最新发布(2024年4月)是自主开发的开源LLM“Arctic”,具有17B个活跃参数。该模型侧重于企业智能指标,即对企业客户至关重要的功能集合。这意味着 LLM 是针对特定用例而设计的,包括编码(HumanEval+ 和 MBPP+)、SQL 生成(Spider)和指令跟踪(IFEval)。
Snowflake GenAI:智能地使用数据 - 升级您的数据!
-
- Posts: 194
- Joined: Sat Dec 21, 2024 5:54 am