Hugging News #0602: Transformers Agents 介绍、大语言模型排行榜发布!

news/2024/5/21 14:11:36

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!

重磅更新

Transformers Agents 发布,通过自然语言控制超过十多万个 HF 模型!

dc57bedbe50f2b68c68f6ebeaf4c2332.jpeg

近期,我们发布了一个非常“大胆”的新特性: Transformers Agents,并加入到了 🤗 Transformers 4.29 之后的版本中。它在 Transformers 的基础上提供了一个自然语言 API,来 “让 Transformers 可以做任何事情”。这其中有两个概念:一个是 Agent (代理),另一个是 Tools (工具),我们定义了一系列默认的工具,让代理去理解自然语言并使用这些工具,文档:
https://hf.co/docs/transformers/transformers_agents

代理这里指的是大语言模型 (LLM),你可以选择使用 OpenAI 的模型 (需要提供密钥),或者开源的 StarCoder 和 OpenAssistant 的模型,我们会提示让代理去访问一组特定的工具。

工具指的是一个个单一的功能,我们定义了一系列工具,然后使用这些工具的描述来提示代理,并展示它将如何利用工具来执行查询中请求的内容。

2be5e42f1c2ffec87cc3877a87989b5b.png

我们在 transformers 中集成的工具包括:文档问答、文本问答、图片配文、图片问答、图像分割、语音转文本、文本转语音、零样本文本分类、文本摘要、翻译等。不过你也可以扩展这些一些与 transformers 无关的工具,比如从网络读取文本等,查看如何开发自定义工具:
https://hf.co/docs/transformers/custom_tools

辅助生成 (Assisted Generation) 发布: 将低延迟文本生成付诸实践,本地大语言模型助手不是梦!

dd73988166f99678b0e07bc69a94c168.png

大语言模型目前广受欢迎,但其响应速度的缓慢限制了其用户体验。对于需要快速反应的任务,人们通常使用规模较小的模型,但这会牺牲结果质量。文本生成的延迟主要来自于模型的前向传递步骤,即模型权重加载到设备计算核心的过程,我们的一篇博文介绍了一种新的解码方法,通过这种辅助生成方法,硬件中的延迟可以降低多达 10 倍。此外,还可以通过模型优化和输入批处理来改善模型前向传递的性能问题。

欢迎阅读中文博客内容 (微信版):https://huggingface.co/blog/zh/assisted-generation

以及这个 Space 应用:https://hf.co/spaces/joaogante/assisted_generation_demo

开源更新

开放的开源大语言模型排行榜

4a721821fe76520b429cdca4857a9461.png

每周都有大量的大型语言模型 (LLM) 和各种聊天机器人发布,令人眼花缭乱~ 我们制作了一个开放的大语言模型排行版,主要目标是跟踪、排名和评估最新的大语言模型和聊天机器人,让所有人方便的观察到开源社区的进展和评估这些模型。这个排行榜有一个关键优势,社区中的任何成员都可以提交模型,并在 Hugging Face 的 GPU 集群上自动评估。

你可以在这里看到这个排行榜:https://hf.co/spaces/HuggingFaceH4/open_llm_leaderboard

Woodstock of AI 活动回顾视频

回顾我们在 3 月底在旧金山举办的 AI 社区会议:


http://wed.xjx100/news/254913.html

相关文章

解决一个典型的商业案例研究任务

介绍 印尼的一家公司 Gojek 通过移动应用程序提供运输和物流、食品和购物、支付、日常需求、商业、新闻和娱乐等服务,对经济做出了超过70亿美元的贡献。 它拥有 90 万注册商户、超过 1.9 亿次应用下载以及超过 200 万名司机能够在120分钟内完成超过18万个订单。我们…

chatgpt赋能python:Python创建界面的重要性及实现方法

Python创建界面的重要性及实现方法 作为一名有10年Python编程经验的工程师,我深知Python在Web开发、数据分析和人工智能等方面的强大表现。然而,Python对于前端的支持一直是一个不被关注的领域。 随着网站、移动应用和电脑软件的普及,用户对…

Java网络编程-API监测

实现一个用于监测 API 接口可用性的线程类,其作用是通过发送 HTTP 请求到指定的 API 接口,并监测接口的可用性。 代码中的 APIThread 类继承自 Thread,意味着它可以在单独的线程中执行。 在 run 方法中,使用 HttpURLConnection …

大数据Doris(三十三):Spark集群搭建

文章目录 Spark集群搭建 一、Spark Standalone 集群搭建 1、下载Spark安装包 2、上传、

windows 安装 minio

windows 安装 minio 1.通过powershell 安装 ~~ Invoke-WebRequest -Uri “https://dl.min.io/server/minio/release/windows-amd64/minio.exe” -OutFile “D:\devtool\minio\minio.exe” setx MINIO_ROOT_USER admin setx MINIO_ROOT_PASSWORD password D:\devtool>m…

【Python】函数 ⑥ ( 变量作用域 | 局部变量 | 全局变量 | global 关键字 | 代码示例 )

文章目录 一、变量作用域1、局部变量2、全局变量3、代码示例 - 函数体内修改全局变量失败4、代码示例 - 函数体内修改全局变量 一、变量作用域 Python 变量 作用域 是 变量的 使用范围 , 变量 在哪些 代码区域中可以被访问 , 在哪些代码块中不能被访问 ; 变量主要分为两类 : 局…

C++ 学习 ::【基础篇:16】:C++ 类的基本成员函数:拷贝构造函数(认识、特征、注意点及典型使用场景)及其基本写法与调用

本系列 C 相关文章 仅为笔者学习笔记记录,用自己的理解记录学习!C 学习系列将分为三个阶段:基础篇、STL 篇、高阶数据结构与算法篇,相关重点内容如下: 基础篇:类与对象(涉及C的三大特性等&#…

arcgis for javascript中的TileLayer(缓存地图服务图层)

一、什么是图层 要理解TileLayer图层,咱要先搞清楚在arcgis中图层的概念: ArcGIS for JavaScript中的图层是数据的可视化链接。简单来说,它可以将数据显示在地图上。 图层是地图上的一个图形单元,可以是点、线、面、文本等&#…