1. Dolly 2.0：世界上第一个完全开源的指令跟随LLM两周前，Databricks发布了类ChatGPT的大型语言模型 (LLM)Dolly，其训练成本不到 30 美元。今天，他们发布了 Dolly 2.0，这是业内第一个开源的指令跟随LLM，并根据高质量的人类生成的指令数据集（15000个prompt/response

lanyue

08-05 23:04

983浏览

0点赞

一次性分割一切，比SAM更强，华人团队的通用分割模型SEEM来了

最近，一篇「一次性分割一切」的新论文《Segment Everything Everywhere All at Once》再次引起关注。在该论文中，来自威斯康星大学麦迪逊分校、微软、香港科技大学的几位华人研究者提出了一种基于 prompt 的新型交互模型 SEEM。SEEM 能够根据用户给出的各种模态的

lanyue

07-29 14:58

977浏览

0点赞

ChatGLM-6B训练性能

尝试了ChatGLM-6B，GPU成本还可以，微调也不错~

payititi-AI助手

07-24 01:23

1036浏览

0点赞

人工智能大模型多场景应用原理解析

学完本篇博文，你将学到哪些内容生成式人工智能和元宇宙相互促进生成式人工智能技术趋势文档结构建模(部首建模、SEM表格建模、训练模型) 文档图像中底层视觉技术(扫描、矫正、去除阴影、防篡改)全景一张图在这里插入图片描述元宇宙生成式人工智能思考生成式人工智能

lanyue

07-14 11:17

1544浏览

3点赞

人工智能行业专题报告：AI大模型需要什么样的数据

AI 大模型需要什么样的数据集数据将是未来 AI 大模型竞争的关键要素人工智能发展的突破得益于高质量数据的发展。例如，大型语言模型的最新进展依赖于更高质量、更丰富的训练数据集：与 GPT-2 相比，GPT-3 对模型架构只进行了微小的修改，但花费精力收集更大的高质量数

lanyue

07-14 11:04

1273浏览

0点赞

AI大模型网络高性能计算分析

揭秘AI大模型背后的高性能计算网络导言——AI 大模型以其优异的自然语言理解能力、跨媒体处理能力以及逐步走向通用 AI 的潜力成为近年 AI 领域的热门方向。业内头部厂商近期推出的大模型的参数量规模都达到了万亿、10 万亿级别。前几天横空出世的 AI 爆款产品 ChatGPT，

lanyue

07-14 10:58

611浏览

0点赞

零基础零成本，手把手部署一个属于你的私有大模型。

随着chatGPT的火爆，许多开源爱好者涌入AI领域，将许多与大型模型相关的工具进行进一步封装，使得我们这些AI初学者也能够用很少的工作量搭建一个私有大型语言模型。而且，有许多成熟的工具可供我们使用，可以帮助我们进一步使用和微调大型模型。因此，本文是为AI初学者

lanyue

07-11 11:12

1353浏览

0点赞

开源大语言模型完整列表

Large Language Model (LLM) 即大规模语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。所谓语言模型，就是只用来处理语言文字（或者符号体系）的 AI 模型，发现其中的规律，可以根据提示 (prompt)，自

lanyue

07-11 10:51

1240浏览

3点赞

AGI最前沿：GPT-4之后大模型学术进展速览

1 前言在ChatGPT，GPT-4出来之后，特别是其API开放使用之后，整个AI学术圈可以说发生了翻天覆地的变化，大家关注的点几乎都集中到了大模型上，大模型相关的研究可以很快获得10x,100x的关注度。arxiv上包含ChatGPT关键词的papers数量按月递增到现在ChatGPT出来已经半年多

lanyue

07-04 11:28

1144浏览

3点赞

大语言模型调研汇总

一. Basic Language Model基础语言模型是指只在大规模文本语料中进行了预训练的模型，未经过指令和下游任务微调、以及人类反馈等任何对齐优化。基础 LLM 基本信息表，GPT-style 表示 decoder-only 的自回归语言模型，T5-style 表示 encoder-decoder 的语言模型，GLM-sty

lanyue

07-04 11:26

2147浏览

4点赞

大模型训练语料篇—已有大规模数据集： C4 / Pile / ROOTS / Wudao

前言大模型的训练，大规模的语料是很重要的，这篇博文跟大家讨论下目前比较出名的大规模语料，讨论它们的来源/多样性/清洗方式等作为参考C42021 EMNLP，T5的训练语料，2021年 4 月数据清洗 URL: https://github.com/google-research/text-to-text-transfer-transformer/

lanyue

11-23 10:37

1040浏览

0点赞

世界首款真开源类ChatGPT大模型Dolly 2.0

众所周知，在 ChatGPT 的问题上 OpenAI 并不 Open，从 meta 那里开源的羊驼系列模型也因为数据集等问题「仅限于学术研究类应用」，在人们还在因为寻找绕过限制方法的时候，主打 100% 开源的大模型来了。4 月 12 日，Databricks 发布了 Dolly 2.0，这是两周前发布的类 Ch

lanyue

07-04 11:09

1038浏览

0点赞

CVPR2023最新论文！含语义分割、扩散模型、多模态、预训练、MAE等方向

CVPR 2023 收录的工作中扩散模型、多模态、预训练、MAE相关工作的数量会显著增长。语义分割/Segmentation - 3 篇Delivering Arbitrary-Modal Semantic Segmentation论文/Paper: arxiv.org/pdf/2303.01…代码/Code: NoneConflict-based Cross-View Consistency for Semi-

lanyue

06-30 15:30

536浏览

0点赞