Select Language

AI社区

AI技术百科

AI影响力人物

世界经济论坛(WEF)未来计算机全球未来理事会主席,卡耐基梅隆大学计算机学院副院长 ,卡塞尔是人形对话代理的发明人,其研究在业界影响深远,最著名的研究成果就是在世界经济论坛上展出的社会感知机器人助理SARA,还有Yahoo-CMU未来私人助手研究项目。卡塞尔尝试将这...
171浏览
0点赞

循环神经网络(RNN)的原理及实现

在前馈神经网络中,信息的传递是单向的,这种限制虽然使得网络变得更容易学习,但在一定程度上也减弱了神经网络模型的能力。在生物神经网络中,神经元之间的连接关系要复杂的多。前馈神经网络可以看着是一个复杂的函数,每次输入都是独立的,即网络的输出只依赖于当前的
128浏览
0点赞

XGBoost算法

XGBoost算法简介XGBoost是一种高效的机器学习算法,它结合了梯度提升决策树(Gradient Boosting Decision Tree, GBDT)和正则化方法,具有良好的泛化能力和准确性。XGBoost主要用于分类和回归问题。XGBoost算法的优势在于其能够自适应地调整树的复杂度,避免过拟合问题
414浏览
3点赞

KNN算法(K最近邻算法)详解

K 最近邻的核心数学知识是距离的计算和权重的计算。我们把需要预测的点作为中心点,然后计算其周围一定半径内的已知点距其的距离,挑选前 k 个点,进行投票,这 k 个点中,哪个类别的点多,该预测点就被判定属于哪一
1070浏览
1点赞

KNN算法的优缺点

优点:简单,易于理解,无需建模与训练,易于实现;适合对稀有事件进行分类;适合与多分类问题,例如根据基因特征来判断其功能分类,kNN比SVM的表现要好。缺点:惰性算法,内存开销大,对测试样本分类时计算量大,性
316浏览
0点赞

KNN算法的流程

KNN算法的流程计算测试数据与各个训练数据之间的距离;按照距离的递增关系进行排序;选取距离最小的K个点;确定前K个点所在类别的出现频率;返回前K个点中出现频率最高的类别作为测试数据的预测分类。下图中给出了KN
398浏览
0点赞

随机森林的Python实现

  利用Python的两个模块,分别为pandas和scikit-learn来实现随机森林。fromsklearn.datasetsimportload_irisfromsklearn.ensembleimportRandomForestClassifierimportpandasaspdimportnumpyasnpiris=load_iris()df
510浏览
2点赞

随机森林工作原理解释的一个简单例子

  描述:根据已有的训练集已经生成了对应的随机森林,随机森林如何利用某一个人的年龄(Age)、性别(Gender)、教育情况(Highest Educational Qualification)、工作领域(Industry)以及住宅地(Residence)共5
350浏览
0点赞

随机森林的生成

  前面提到,随机森林中有许多的分类树。我们要将一个输入样本进行分类,我们需要将输入样本输入到每棵树中进行分类。打个形象的比喻:森林中召开会议,讨论某个动物到底是老鼠还是松鼠,每棵树都要独立地发表自己
339浏览
0点赞

随机森林的相关基础知识

  随机森林看起来是很好理解,但是要完全搞明白它的工作原理,需要很多机器学习方面相关的基础知识。在本文中,我们简单谈一下,而不逐一进行赘述,如果有同学不太了解相关的知识,可以参阅其他博友的一些相关博文
569浏览
0点赞

随机森林的特点

 我们前边提到,随机森林是一种很灵活实用的方法,它有如下几个特点:在当前所有算法中,具有极好的准确率/It is unexcelled in accuracy among current algorithms;能够有效地运行在大数据集上/It runs efficient
366浏览
0点赞

什么是随机森林?

作为新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销到医疗保健保险,既可以用来做市场营销模拟的建模,统计客户来源,保留和流失,也可用来预测疾病的风
388浏览
0点赞

什么是k最近邻算法(kNN)

K近邻算法又称KNN,全称是K-Nearest Neighbors算法,它是数据挖掘和机器学习中常用的学习算法,也是机器学习中最简单的分类算法之一。KNN的使用范围很广泛,在样本量足够大的前提条件之下它的准确度非常高。KNN是一
352浏览
0点赞

机器学习--SVM算法实现

一. 使用sklearn中的数据集做案例%matplotlibinlineimportnumpyasnpimportmatplotlib.pyplotaspltfromscipyimportstats#使用seaborn绘制默认值importseabornassns;sns.set()#随机来点数据fromsklearn.datasets.sampl
380浏览
0点赞

非线性SVM算法原理

对于输入空间中的非线性分类问题,可以通过非线性变换将它转化为某个维特征空间中的线性分类问题,在高维特征空间中学习线性支持向量机。由于在线性支持向量机学习的对偶问题里,目标函数和分类决策函数都只涉及实例
369浏览
1点赞

支持向量机(support vector machines, SVM)

SVM简介支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;SVM还包括核技巧,这使它成为实质上的非线性分类器。SVM
357浏览
1点赞

DBSCAN算法过程

DBSCAN算法的核心思想如下:从某个选定的核心点出发,不断向密度可达的区域扩张,从而得到一个包含核心点和边界点的最大化区域,区域中任意亮点密度相连考虑数据集合。DBSCAN算法的目标是将数据集合 X 分成 K 个clus
333浏览
0点赞

DBSCAN模型

考虑数据集合,首先引入以下概念与数学记号:1.∈邻域(∈ neighborhood)设,称为 x 的∈邻域。显然,2. 密度(density)设,称为 x 的密度。注意,这里的密度是一个整数值,且依赖于半径∈3. 核心点(core point)
371浏览
0点赞

基于密度的聚类方法(DBSCAN)

与均值漂移聚类类似,DBSCAN也是基于密度的聚类算法。 具体步骤: 1. 首先确定半径r和minPoints. 从一个没有被访问过的任意数据点开始,以这个点为中心,r为半径的圆内包含的点的数量是否大于或等于minPoints,如果
421浏览
0点赞

用高斯混合模型(GMM)的最大期望(EM)聚类

K-Means的缺点在于对聚类中心均值的简单使用。下面的图中的两个圆如果使用K-Means则不能作出正确的类的判断。同样的,如果数据集中的点类似下图中曲线的情况也是不能正确分类的。使用高斯混合模型(GMM)做聚类首先
359浏览
0点赞

凝聚层次聚类

层次聚类算法分为两类:自上而下和自下而上。凝聚层级聚类(HAC)是自下而上的一种聚类算法。HAC首先将每个数据点视为一个单一的簇,然后计算所有簇之间的距离来合并簇,知道所有的簇聚合成为一个簇为止。 下图为凝聚
413浏览
0点赞

神经网络训练的一般步骤

Step1:随机初始化权重;Step2:实现前向传播算法,拿到各个输入的激活函数;Step3:编码计算代价函数;Step4:实现反向传播计算激活函数的偏导数。看一下伪代码:代码中的m是训练样本的个数。Step5:使用梯度检验验
390浏览
0点赞

生成对抗网结(Generative Adversarial Network, GAN)

生成对抗网结(Generative Adversarial Network, GAN): 由Goodfellow在2014年提出,其核心思想来自于博弈论的纳什均衡”。它包含两个网络模型:一个生成模型和一个判别模型。生成模型捕捉样本数据的分布,判别模型是
281浏览
0点赞

深度信念网结(Deep Belief Nets, DBN)

深度信念网结(Deep Belief Nets, DBN): 或称深度置信网络,神经网络的一种,由多个受限玻尔兹曼机组成。既可以用于非监督学习,类似于一个自编码器,也可以用于监督学习,类似于一个分类器。从非监督学习来讲,其目
290浏览
0点赞

自动编码器(AutoEncoder)

自动编码器(AutoEncoder):是人工神经网络的一种,主要用来处理数据的压缩,其数据的压缩和解压缩函数是数据相关的、有损的、从样本中自动学习的。原理为训练神经网络,通过捕捉可以代表输入信息的最关键的因素,让
602浏览
1点赞

长短期记忆网络(Long Short-Term Memory, LSTM)

长短期记忆网络(Long Short-Term Memory, LSTM):是一种时间递归神经网络,适合用于处理和预测时间序列中间隔和延迟较长的重要事件。基于LSTM的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别、
346浏览
0点赞

递归神经网络(Recurrent Neural Network, RNN)

前馈神经网络只能单独处理一个的输入,不同的输入之间被认为是相互独立没有联系的,但实际上很多时候输入之间是有序列关系的,需要使用递归神经网络(Recurrent Neural Network, RNN), 也称循环神经网络,其引入了
331浏览
0点赞

卷积神经网络(CNN)

卷积神经网络(CNN): 由Yann LeCun提出并应用在手写字体(MINST)识别上,其实质是一种多层前馈网络,擅长处理图像特别是大图像的处理和识别。
323浏览
0点赞

深度神经网络(DNN)

深度神经网络(DNN):使用统计学方法从原始感官数据中提取高层特征,在大量的数据中获得输入空间的有效表征。 简单理解,深度神经网络就是有多个隐藏层的多层感知器网络,根据实际应用情况不同,其形态和大小也都不
396浏览
0点赞

径向基函数神经网络(Radical Basis Function Neural Network, RBF NN)

径向基函数神经网络(Radical Basis Function Neural Network, RBF NN): 1988 年由 John Moody和Christian J Darken提出了一种网络结构,属于前向型神经网络,理论上可以任意精度逼近任意连续函数,适合解决分类问题
329浏览
0点赞

受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)

受限玻尔兹曼机(Restricted Boltzmann Machine, RBM),是一种简化的特殊的玻尔兹曼机,1986年由Paul Smolensky提出。和BM相比,其隐藏层中的节点之间没有互相连接,其可见节点间也没有连接,因此其计算相对更简单
341浏览
0点赞

方差(Variance)

方差和标准差是测度数据变异程度的最重要、最常用的指标。
377浏览
0点赞

sigmoid函数

sigmoid函数也叫Logistic函数,用于隐层神经元输出,取值范围为(0,1),它可以将一个实数映射到(0,1)的区间,可以用来做二分类。在特征相差比较复杂或是相差不是特别大时效果比较好。
338浏览
0点赞

9.1、TCP/IP协议详解

计算机之间要交换信息,就需要定义交换信息的方式。1965年,Donald Davies 创造了报文这个词语,用来描述在两台计算机之间传输的数据。在1969年,最早的广域网 ARPNET 出现了,这个网络也是第一个使用报文交换的网络(相对报文交换,早期的电话使用的是电路交换,就是在
284浏览
0点赞

9.2、Socket是什么

通过前面的介绍,是不是觉得 TCP/IP 很复杂,我们其实不必去完全了解这些协议的内部细节,因为对于多数用户来说,所关心的是如何使用这些协议来传输数据。本节将介绍一套历史悠久的接口——socket。使用 socket 我们就不用直接和这些协议打交道了,也不用了解这些协议的
367浏览
0点赞

9.3、TCP echo服务器的建立(Python实现)

本节我们将编写一个简单的 echo 服务器。该服务器等待用户的连接,连接成功后,它将接收到的用户的任何输入都原封不动地回送给客户端,直到用户关闭了连接,此时服务器自动退出。这个例子使用了 TCP 协议,使用的协议是在创建 socket 时指定的,方法如下:s = socket.so
308浏览
0点赞

9.4、编写简单的TCP客户端

在《TCP echo服务器的建立》一节的基础上,我们还需要一个客户端,这样才能实现数据交互。本节将编写一个这样的客户端,它和前面介绍的服务器建立连接,并发送一串简单的数据,然后读取服务器的返回数据。首先需要创建一个 socket 对象。和服务器端一样,也是指定使用 T
339浏览
0点赞

9.5、UDP echo服务器的建立(Python实现)

《TCP echo服务器的建立》和《编写简单的TCP客户端》分别介绍了使用 TCP 协议编写 echo 服务的服务器端代码和客户端代码。本节将实现一个 UDP 版的 echo 服务。虽然 TCP 和 UDP 区别很大,但是从 socket 接口来说它们并没有太大的区别,只是在 socket 创建时需要指定 so
326浏览
1点赞

8.1、什么是多线程,Python多线程编程

早在 20 世纪 60 年代,进程的概念就出现了。但进程是资源的拥有者,进程的创建、销毁、调度代价都比较高,所以出现了对轻量级进程的需求。到了 20 世纪 80 年代,出现了线程,类似于进程,线程可以独立运行,但使用的代价比进程小很多。线程一般包括程序、数据和线程控
332浏览
0点赞

8.2、Python thread模块用法详解

该包在 Python 2 中属于正常可用状态,但在 Python 3 中处于即将废弃的状态,虽然还可以用,但包名被改为 _thread。使用 thread 包首先要引入该包,在 Python 2 中使用下面的语句来引入:import thread而在 Python 3 中,由于包名从 thread 改为了 _thread,所以需要使
265浏览
0点赞

8.3、Python threading模块用法精讲

相对于 thread 包,threading 包提供了更多的功能。该包的用法基本分成两步:第一步是构造一个 threading.Thread 实例对象,这时该对象对应的线程就处于“新建”状态;第二步是操作该对象,如调用 start() 来将该线程转换到“就绪”状态。创建线程实例对象我们可以创建
305浏览
0点赞

8.4、Python线程同步实现方式详解

一个线程启动后,其会自行运行。但如果希望它们能同步运行,应该怎么做呢?举个简单的例子,有两个线程 A 和 B,A 负责从网络上读取数据,保持到变量 X 中,B 负责处理变量X中的数据,这时线程 B 就需要和 A 同步。也就是说 B 需要等 A 给其一个信号,其才可以开始去做
334浏览
0点赞

8.5、Python线程安全(同步锁机制)

所谓线程安全,就是说对某个资源的访问在多线程状态下和单线程状态下得到相同的结果,结果不会受到线程调度等因素的影响。例如下面这段代码,在函数 operate_resource() 中为 g_list 添加一个新元素,新元素的值为 g_list 最后一个元素的值加 1。g_list=[]defoperate_res
330浏览
0点赞

8.6、Python线程死锁的原因及解决方法

死锁是多线程编程中经常讨论的问题,所谓死锁,就是线程一直无限期地等待某个资源。最简单的死锁现象就是一个线程等待一个自己已经拿到的锁。由于该锁已经被自己拿到了,所以第二次申请该锁时会被放到等待队列中,但这个等待的时间是永远。下面的代码演示了这种情况。格
269浏览
0点赞

8.7、什么是进程

在计算机发展的早期阶段,任务调度方式比较简单,计算机从用户处得到任务,然后一直执行下去,直到指定任务完成,然后计算机等待用户的下一个计算任务。在这种运行方式下,任意时刻计算机都只能完成一个任务。如果该任务处于等待状态,计算机也不能执行其他的任务。为了
369浏览
0点赞

8.8、Python subprocess模块用法详解

在 Python 2.7 及 Python 3 中,系统自带了 subprocess 模块,该模块主要用来管理子进程。在使用该模块之前需要将其引入,方法如下:import subprocess在以前,启动一个新的进程可以使用 os.system() 方法。相对来说 subprocess 模块提供了更多的灵活性,可以完全取代 o
323浏览
0点赞

8.9、Python multiprocessing模块精讲

multiprocessing 模块无须安装,从 Python 2.6 开始系统便自带该模块了。该模块的接口函数和 threading 类似,但是它启动的是进程而不是线程。使用该模块时需要先将其引入 multiprocessing,方法如下:import multiprocessing该模块包含很多类,如Lock,其和多线程中的
330浏览
0点赞

8.10、Python os模块用法详解

在本章的最后,我们来介绍一下 os 模块中有关进程的一些接口函数。在前面已经用到了该模块一些接口函数,如得到当前进程的 PID。这些接口函数比较基础,在不太复杂的环境中也是非常有用的。如果必须使用进程的一些高级特性,还是推荐使用 multiprocessing 模块或者 subp
280浏览
0点赞

7.1、Python类的定义与使用

类最基本的功能就是定义了一个新的类型。可以使用下面的语法来定义一个空类,即一个什么属性都没有的类,一个什么事情也做不了的类。class类名:pass这里的类名要求和变量名一样,可以由字母、数字和下划线组成,一般首字符是大写的字母,对于长度没有限制。类定义完之后
273浏览
0点赞

7.2、Python __init__()和__del__()函数的用法

__init__()(后续称之为初始化函数)是用来初始化实例对象的。每次构造一个实例对象时,都会调用该类的初始化函数。在该初始化函数中可以初始化实例对象,或者更新类的某些属性,如该类构造出来的实例对象的个数。初始化函数也可以带参数,通过不同参数来构造不同的实例
279浏览
0点赞

7.3、Python类属性和实例属性

其实类本身也是一个对象,它也有自己的属性。类的属性一般表示类的相关内容,如类的版本和作者等信息。类的属性的定义是在类里面直接定义一个变量即可。下面我们给类 Student 添加版本和作者信息。 class Student: # 定义类Student... version = 1.0 # 类的属性version.
275浏览
0点赞

7.4、Python self的用法

对象属性在类外面使用“对象名。属性”来表示,在类里面使用“self.属性”来表示。对于对象的属性也存在增删改查操作,如可以用赋值语句来修改或者添加属性,通过 del() 来删除对象属性。添加属性对于 Python 这种动态语言来说非常简单,它对添加的时间没有要求,可以在
284浏览
0点赞

7.5、Python getattr()、setattr()、hasattr()和delattr()的用法

除了使用前面介绍的方法来操作属性外,还有一套通用的方法来操作属性。这种方法类似于静态反射机制,即在不知道对象具体定义的情况下,也能通过查询等方式得到该对象的一些情况。如我们得到一个对象 a,但对象 a 是什么类型、包含哪些属性我们都不知道,那么就可以用 di
287浏览
0点赞

7.6、Python静态方法的使用

静态方法就是该方法没有绑定某个对象。和对象方法不同的是,其定义时第一个参数不是 self,这看起来更像一个普通方法。由于没有 self 参数,所以也不能使用“self.属性名”来访问某个对象的属性了。静态方法的定义格式如下:@staticmethoddefstatic_func():pass在 Stude
257浏览
0点赞

7.8、Python类方法的使用

类方法也不属于某个对象,所以其第一个参数也不为self。但它属于某个类,所以其第一个参数一定是cls。@classmethoddefstatic_func(cls,参数列表):pass在使用时不需要指定第一个参数 cls,因为该函数有一个隐含的属性 __self__,它就是 cls 的值。 class Student: # 定义
295浏览
0点赞

7.9、Python类的私有属性

在 C++ 和 Java 中,属性(成员)有访问控制,如 public 表示任意代码可以访问该属性,private 表示仅当前类的代码才可以访问该属性。Python 中没有这个访问控制符,但是可以在属性前面加上 __ 两个下划线来表示该属性不能在类外部访问。一般的属性都是可以在类的外部访
292浏览
0点赞

7.9、Python只读属性的设置(2种方法)

默认情况下,实例对象的所有成员都是可以读和写的。但有时希望做一些限制,如只能读不能修改,或者检查修改的值必须符合类型要求或者范围要求。实现该功能的方法有多种,这里主要介绍使用 @property 修饰符和定义 __setattr__() 函数两种方法。使用@property修饰符该方
300浏览
0点赞

7.10、Python类的派生(派生类)

派生是面向对象编程的基本概念,它赋予了我们基于某个基础类来轻松创建新类的能力。使用派生类的方法,我们可以复用他人的代码,不必从 0 开始创建自己的轮子。定义一个基于某个现有类的新类的方法如下:def新类(现有的类):pass现有的类,有时也称为基类、父类;新类也
292浏览
0点赞

6.1、Python异常处理机制

异常处理也是现代编程语言的基本特性,使用异常处理可以将正常分支和异常分支分割开来,而不像 C 语言那样,正常分支和异常分支是混在一起的。在 Python 中,异常就是一个特殊的对象,通过该异常对象可以给异常处理函数传递异常发生时的信息。Python 2 和 Python 3 中异
301浏览
0点赞

6.2、Python try except语句:捕获异常

捕捉异常就是如果某个代码段中出现了异常,需要定义好相应的异常处理代码。这样异常就被处理掉了,而不是一直向上传递,直到最后导致整个程序退出。下面介绍几种捕捉异常的方法。1) 捕捉任意异常最简单的处理方式是捕捉任意异常,方法是使用下面的分支语句:except:该分
298浏览
0点赞

6.3、Python try else语句的用法

前面介绍的都是 except 分支,也就是异常分支。except 分支在发生异常时被执行。本节介绍的分支在没有抛出异常时才被执行,这就是 else 分支。下面演示了这种用法。 def except_demo(a, b): # 定义一个包含异常处理的函数... try:... a = a / b... except ZeroDivisionE
280浏览
0点赞

6.4、Python try finally语句的用法

前面介绍了 except 分支和 else 分支,它们分别在有异常抛出和没有异常抛出时被执行。接下来介绍另一个分支,该分支在任何情况下都会被执行,而且是在最后被执行,这就是 finially 分支。下面是 finally 分支的一个例子。 def finally_demo(a, b): # 定义一个包含异常处
344浏览
0点赞

6.5、Python raise语句:主动抛出异常

通常情况下,我们的代码不会主动抛出异常,而是通过返回一个错误码来告知调用者这里出现了不该出现的错误。其实我们也可以在代码中抛出异常,通过异常将相关的错误信息发送出去。可以使用 raise 语句来抛出异常,该语句后面需要带一个对象,该对象必须是派生自 BaseExce
195浏览
0点赞

深入解析大型语言模型:从训练到部署大模型

简介随着数据科学领域的深入发展,大型语言模型——这种能够处理和生成复杂自然语言的精密人工智能系统—逐渐引发了更大的关注。LLMs是自然语言处理(NLP)中最令人瞩目的突破之一。这些模型有潜力彻底改变从客服到科学研究等各种行业,但是人们对其能力和局限性的理解
135浏览
0点赞

智源x复旦 | Argus-3D形状生成大模型,多模态生成3D形状

令人心潮澎湃的游戏装备、栩栩如生的VR与AR视界、充满惊奇想象的艺术与设计创作……伴随虚拟与现实边界的日益融合,三维形状生成模型的研究备受关注。不同于当前主流大语言模型,三维形状生成比一维文本更加复杂,任务难度也更高。近日,智源研究院与复旦大学联合带来 A
136浏览
0点赞

LLM的当前挑战和应用

从毫无存在感到无人不谈,大型语言模型(LLM)的江湖地位在这几年发生了巨变。这个领域的发展令人目不暇接,但也正因如此,人们难以了解还有什么难题有待解决以及哪些领域已有成熟应用。为了帮助机器学习研究者更快理解 LLM 领域的当前现状并提升他们的生产力,来自伦敦
113浏览
0点赞

GPT-4炸圈--多模态大模型

前言在chatGPT如火如荼的时候,OpenAI又上演了王者归来的戏码,重磅发布了GPT-4。GPT-4是作为“帮你写代码”和你“肆意聊天”的chatGPT的基础模型GPT-3的升级版,是一个新的里程碑。GPT-4是一个大型多模态模型,虽然很多能力还不能达到人类水平,但是某些专业和学术领域
122浏览
0点赞

全球首个完全开源的指令跟随大模型;T5到GPT-4最全盘点

1. Dolly 2.0:世界上第一个完全开源的指令跟随LLM两周前,Databricks发布了类ChatGPT的大型语言模型 (LLM)Dolly,其训练成本不到 30 美元。今天,他们发布了 Dolly 2.0,这是业内第一个开源的指令跟随LLM,并根据高质量的人类生成的指令数据集(15000个prompt/response
141浏览
0点赞

一次性分割一切,比SAM更强,华人团队的通用分割模型SEEM来了

最近,一篇「一次性分割一切」的新论文《Segment Everything Everywhere All at Once》再次引起关注。在该论文中,来自威斯康星大学麦迪逊分校、微软、香港科技大学的几位华人研究者提出了一种基于 prompt 的新型交互模型 SEEM。SEEM 能够根据用户给出的各种模态的
151浏览
0点赞

人工智能大模型多场景应用原理解析

学完本篇博文,你将学到哪些内容 生成式人工智能和元宇宙相互促进 生成式人工智能技术趋势 文档结构建模(部首建模、SEM表格建模、训练模型) 文档图像中底层视觉技术(扫描、矫正、去除阴影、防篡改)全景一张图在这里插入图片描述元宇宙生成式人工智能思考生成式人工智能
223浏览
0点赞

人工智能行业专题报告:AI大模型需要什么样的数据

AI 大模型需要什么样的数据集数据将是未来 AI 大模型竞争的关键要素人工智能发展的突破得益于高质量数据的发展。例如,大型语言模型的最新进展依赖于更 高质量、更丰富的训练数据集:与 GPT-2 相比,GPT-3 对模型架构只进行了微小的修改, 但花费精力收集更大的高质量数
168浏览
0点赞

AI大模型网络高性能计算分析

揭秘AI大模型背后的高性能计算网络导言——AI 大模型以其优异的自然语言理解能力、跨媒体处理能力以及逐步走向通用 AI 的潜力成为近年 AI 领域的热门方向。业内头部厂商近期推出的大模型的参数量规模都达到了万亿、10 万亿级别。前几天横空出世的 AI 爆款产品 ChatGPT,
171浏览
0点赞

「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系

人工智能是一个庞大的研究领域。虽然我们已经在人工智能的理论研究和算法开发方面取得了一定的进展,但是我们目前掌握的能力仍然非常有限。机器学习是人工智能的一个重要领域,它研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,并通过重新组织已有的知
122浏览
0点赞

零基础零成本,手把手部署一个属于你的私有大模型。

随着chatGPT的火爆,许多开源爱好者涌入AI领域,将许多与大型模型相关的工具进行进一步封装,使得我们这些AI初学者也能够用很少的工作量搭建一个私有大型语言模型。而且,有许多成熟的工具可供我们使用,可以帮助我们进一步使用和微调大型模型。因此,本文是为AI初学者
182浏览
0点赞

AI 绘画基于 Kaggle 10 分钟搭建 Stable Diffusion(保姆级教程)

当前最火的、也是日常绘画最常用两个 AI 绘画工具就属 Midjourney 和 Stable Diffusion 了。而相对于 Midjourney(基础版也要 $10 / month)来说,Stable Diffusion 最大的好处就是:完全免费! (免费啊,宝子们)完全开源!但是 Stable Diffusion 的安装部署比较复杂
164浏览
0点赞

开源大语言模型完整列表

Large Language Model (LLM) 即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。所谓语言模型,就是只用来处理语言文字(或者符号体系)的 AI 模型,发现其中的规律,可以根据提示 (prompt),自
255浏览
3点赞

AGI最前沿:GPT-4之后大模型学术进展速览

1 前言在ChatGPT,GPT-4出来之后,特别是其API开放使用之后,整个AI学术圈可以说发生了翻天覆地的变化,大家关注的点几乎都集中到了大模型上,大模型相关的研究可以很快获得10x,100x的关注度。arxiv上包含ChatGPT关键词的papers数量按月递增到现在ChatGPT出来已经半年多
167浏览
1点赞

大语言模型调研汇总

一. Basic Language Model基础语言模型是指只在大规模文本语料中进行了预训练的模型,未经过指令和下游任务微调、以及人类反馈等任何对齐优化。基础 LLM 基本信息表,GPT-style 表示 decoder-only 的自回归语言模型,T5-style 表示 encoder-decoder 的语言模型,GLM-sty
177浏览
0点赞

世界首款真开源类ChatGPT大模型Dolly 2.0

众所周知,在 ChatGPT 的问题上 OpenAI 并不 Open,从 meta 那里开源的羊驼系列模型也因为数据集等问题「仅限于学术研究类应用」,在人们还在因为寻找绕过限制方法的时候,主打 100% 开源的大模型来了。4 月 12 日,Databricks 发布了 Dolly 2.0,这是两周前发布的类 Ch
198浏览
0点赞

人工智能 (AI)

人工智能 (AI)一、人工智能简介1.1.人工智能定义和发展历史1.2.人工智能发展必备三要素1.2.1.三要素1.2.人工智能发展必备三要素二、实现人工智能实现的核心技术2.1、数据科学2.1.1 数据科学定义2.1.2 数据科学应用流程2.1.3 数据科学于机器学习对比2.2、计算机视觉2.3、
247浏览
0点赞

详解文生图视觉AIGC原理

概述视觉领域的AIGC常用的几类技术:其对比如下GAN这里简单阐述一下GAN做图像生成的优缺点,不对技术细节做展开优点是保真度高,缺点是训练不够稳定,因为要同时训练生成器和判别器,存在一个平衡的问题,训练不好容易造成训练坍塌;另外GAN的目标是生成图片的尽量真实
210浏览
0点赞

完全免费白嫖 GPT-4 的终极方案!

GPT-4 目前是世界上最强的多模态大模型,能力甩 GPT-3.5 好几条街。大家都希望早日用上 GPT-4,不过目前体验 GPT-4 的渠道非常有限,要么就是开通 ChatGPT 尊贵的 Plus 会员,即使你开了会员,也是有限制的,每 3 小时只能发送 25 条消息。。。要么就去 OpenAI 官网申请
157浏览
0点赞

Midjourney 中文使用指南

第一章:MidJourney 基础与费用问题1.1 注册、下戰、基础操作1.2 费用问题第二章:MidJourney 修改预设及其他命令2.1 版本切换2.2 绘图质量2.3 风格切换2.4 Upscale2.5 Mode2.6 自定义设置第三章:MidJourney 参数解析3.1 基础参数3.2 Upscaler 参数3.3 其它参数3.4 已
95浏览
0点赞

ARHUD驾车导航技术概览

ARHUD (Augmented Reality Head Up Display),即增强现实与抬头显示的结合,是一种将渲染元素投影在真实世界的技术,也是目前用户理解成本最低的展示方式。HUD功能第一次应用是在二战中,被应用在枪械和战斗机上,80年代初期开始转向民用,90年代初期技术概念被正式提出
164浏览
0点赞

CVPR2023最新论文!含语义分割、扩散模型、多模态、预训练、MAE等方向

CVPR 2023 收录的工作中扩散模型、多模态、预训练、MAE相关工作的数量会显著增长。语义分割/Segmentation - 3 篇Delivering Arbitrary-Modal Semantic Segmentation论文/Paper: arxiv.org/pdf/2303.01…代码/Code: NoneConflict-based Cross-View Consistency for Semi-
166浏览
0点赞

机器学习中的特征工程

特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系
134浏览
0点赞

免费部署一个开源大模型 MOSS

2023年初,ChatGPT 人工智能对话模型火爆全球,仅两个月的时间就突破一亿月活用户,成为有史以来应用速度最快的技术之一。ChatGPT 的大热引发了全球科技巨头之间的“军备竞赛”,中国本土的“中国版 ChatGPT ”也随之展开了激烈角逐。在中国多家科技公司中,百度于3月上
143浏览
0点赞

AI技术学习方法及相关算法

业内通常将人工智能分类为机器学习、计算机视觉、语音交互和自然语言处理四大领域,机器学习可以理解为是其他三大领域的底层基础,大致可以分为监督学习、非监督学习、强化学习、迁移学习。本文在此基本不涉及公式,尽量以平直易懂的语言讲述这几种机器学习方法及相关算
179浏览
0点赞

AI应用领域

AI目前主要的应用领域有3个方向,包括:计算机视觉、语音交互、自然语言处理。1.1 计算机视觉(CV)计算机视觉是一门研究如何使机器“看”的科学,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉的应用,是使用计算机及相关设备对生物视觉的一种
286浏览
0点赞

Maxout与Dropout

Dropout是一种网络规则化技巧,其实它就是相当于在训练很多个不同的网络结构,尽管如此,推理阶段所有不同结构的参数依然是共享的,因为实际上只有一个网络存在。在机器学习算法中,有一个概念叫做bagging,bagging
552浏览
0点赞

没有免费的午餐定理(No Free Lunch Theorem,简称 NFL)

我们经常听人谈论“什么算法更好”或者“A算法比B算法好”这样类似说法,其实这样的说法忽略了一个前提,那就是在解决某一个具体的问题(任务)上。为什么这么说呢,因为如果考虑所有潜在的问题,所有的学习算法都一
378浏览
1点赞

什么是欠拟合与过拟合?

我们希望通过机器学习学得的模型的泛化能力比较强,直白来说就是使得学得的模型不仅仅在在训练样本中工作得很好,更应该在新的样本中工作很好。通常我们把分类错误的样本数占总样本数的比例称为错误率(error rate)
358浏览
2点赞

7个重点的机器学习的方法

机器学习里面究竟有多少经典的算法呢?在这个部分我会简要介绍一下机器学习中的经典代表方法。这部分介绍的重点是这些方法内涵的思想,数学与实践细节不会在这讨论。  1、回归算法  在大部分机器学习课程中,回
356浏览
1点赞

2021cvpr PVGNet: 自下而上的单级三维物体检测器,集成了多层次的功能

FeaturesZhenwei Miao, Jikai Chen, Hongyu Pan, Ruiwen Zhang, Kaixuan Liu, Peihan Hao, Jun Zhu, Yang Wang, Xin Zhan; Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CV
370浏览
0点赞

2021 CVPR 最佳学生论文荣誉提名(Best Student Paper Honorable Mentions)

最佳学生论文荣誉提名(Best Student Paper Honorable Mentions)获得「最佳学生论文」提名的有三篇Less is More: ClipBERT for Video-and-Language Learning via Sparse Sampling(少即是多:通过稀疏取样进行视频
464浏览
0点赞

2021 CVPR 最佳学生论文奖(Best Student Paper)

最佳学生论文奖(Best Student Paper)Task Programming: Learning Data Efficient Behavior Representations(任务编程:学习数据有效的行为表征)作者团队来自加州理工和西北大学——Jennifer J. Sun, Ann Kennedy, Eric Zhan, David J. Anderson, Yisong Yue, Pietro
461浏览
0点赞

2021CVPR 最佳论文荣誉提名(Best Paper Honorable Mentions)

何恺明和Xinlei Chen的论文Exploring Simple Siamese Representation Learning(探索简单的连体表征学习)获得了最佳论文提名。https://arxiv.org/abs/2011.10566论文主要研究了:「连体网络」(Siamese networks)已经成为最近各种无监督视觉表征学习模型中的一种常见
308浏览
0点赞

2021 CVPR 论文奖

最佳论文奖(Best Paper)今年的最佳论文是马克斯·普朗克智能系统研究所和蒂宾根大学团队的Michael Niemeyer, Andreas Geiger,他们的论文是GIRAFFE: Representing Scenes as Compositional Generative Neural Feature Fields(GIRAFFE:将场景表现为组合生成的神经特
477浏览
0点赞

国际计算机视觉与模式识别会议(CVPR)

国际计算机视觉与模式识别会议(CVPR)是IEEE一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术。CVPR是世界顶级的计算机视觉会议(三大顶会之一,另外两个是ICCV和ECCV),近年来每年有约1500名参加
365浏览
0点赞

国际计算机视觉大会 International Conference on Computer Vision

ICCV,英文全称International Conference on Computer Vision,中文全称国际计算机视觉大会,这个会议也是由IEEE主办的全球最高级别学术会议,每两年在世界范围内召开一次,在业内具有极高的评价。ICCV论文录用率非
837浏览
0点赞

欧洲计算机视觉国际会议 European Conference on Computer Vision

ECCV,英文全称European Conference on Computer Vision,中文全称欧洲计算机视觉国际会议。ECCV每年的论文接受率为25-30%左右,每次会议在全球范围会收录论文300篇左右,收录论文的主要来源是来自于美国、欧洲等顶