创业基础课程学习什么,创业基础论文题目 创业基础课程学习什么,创业基础论文题目
创始人
2025-07-18 18:16:25
0

  作者|对话   

  

  出品|算法对话屋   

  

  编者寄语:   

  

  了解未来AI最热门的技术:自我监督学习。   

  

  大家好,我是对白。   

  

  如果把人工智能比作一块蛋糕,那么蛋糕上的大部分是自我监督学习,蛋糕上的糖衣是监督学习,蛋糕上的樱桃是强化学习。   

  

  Yann Lecun在演讲中介绍了“蛋糕类比”来说明自监督学习的重要性.虽然这个类比有争议,但我们也看到了自监督学习的影响,自然语言处理领域的最新发展(wordpetch,Glove,ELMO,   

  

  BERT),接受了自我监督,取得了最好的效果。   

  

  “如果说人工智能是一块蛋糕,那么蛋糕上的大部分就是自监督学习,蛋糕上的糖衣就是监督学习,蛋糕上的樱桃就是强化学习(RL)。”   

  

  出于对自我监督学习在CV、NLP和推荐领域,的应用的好奇,我从最近的工作中了解到,并查阅了大量的论文,希望用最通俗易懂的方式向大家解释清楚。   

  

  自监督学习这项技术的魅力.   

  

  这篇文章是我对自我监督学习的直观总结。   

  

     

  

  #一.概述   

  

     

  

     

  

     

  

  # 1.1基于上下文   

  

  许多任务可以基于数据本身的上下文信息来构建。用拼图的方式构造借口,比如把一张图片分成9个部分,通过预测这些部分的相对位置产生损失;通过抠图构造托辞,随机删除图片的一部分,用剩下的预测被扣除的部分;预测图片的颜色,比如输入图像的灰度,预测图片的颜色。   

  

  # 1.2基于时间序列(基于时间)   

  

  在视频和其他场景中,不同样本之间也存在基于时间的约束。   

  

  # 1.3基于对比   

  

  附言:我的最爱   

  

     

  

  学会对两个事物的相似性或不相似性进行编码来构造一个表象,即通过构建正负样本,然后度量正负样本的距离来实现自监督学习.核心样本和阳性样本之间的相似性远大于样本和阴性样本之间的相似性,类似Triplet模式.   

  

  #二。主要方法   

  

  # 2.1基于上下文   

  

  论文一:《Rethinking Data Augmentation: Self-Supervision and Self-   

  

  蒸馏   

  

     

  

  Data augmentation and self-supervision   

  

  数据增强相关方法将通过变换原始图像(颜色、旋转、裁剪等)来扩展原始训练集。)并提高模型的泛化能力。   

  

  多任务学习结合了正常分类和自监督学习的任务(如旋转预测)。   

  

  作者指出,通过数据增强   

tation或者multi-task

  

learning等方法的学习强制特征具有一定的不变性,会使得学习更加困难,有可能带来性能降低。

  

因此,作者提出将分类任务的类别和self-supervised learning的类别组合成更多类别(例如 (Cat,

  

0),(Cat,90)等),用一个损失函数进行学习。

  

Self-distillation from aggregation

  

在学习的过程中限制不同旋转角度的平均特征表示和原始图片的特征表示尽可能接近,这里使用KL散度作为相似性度量。

  

  

第一项和第二项分别对应图a和图b,第三项是正常的分类交叉熵损失,作为一个辅助loss。

  

论文二《S4L: Self-Supervised Semi-Supervised Learning》

  

  

自监督和半监督学习(大量数据没有标签,少量数据有标签)也可以进行结合,对于无标记的数据进行自监督学习(旋转预测),和对于有标记数据,在进行自监督学习的同时利用联合训练的想法进行有监督学习。通过对

  

imagenet 的半监督划分,利用 10% 或者 1% 的数据进行实验,最后分析了一些超参数对于最终性能的影响。

  

对于标记数据来说,模型会同时预测旋转角度和标签,对于无标签数据来说,只会预测其旋转角度,预测旋转角度”可以替换成任何其它无监督task(作者提出了两个算法,一个是

  

S^4L-Rotation,即无监督损失是旋转预测任务;另一个是S^4L-Exemplar,即无监督损失是基于图像变换(裁切、镜像、颜色变换等)的triplet损失)

  

总的来说,需要借助于无监督学习,为无标注数据创建一个pretext task,这个pretext

  

task能够使得模型利用大量无标注学习一个好的feature representation

  

# 2.2 基于时序(Temporal based)

  

之前介绍的方法大多是基于样本自身的信息,比如旋转、色彩、裁剪等。而 样本间其实也是具有很多约束关系的,比如视频相邻帧的相似性、物体多个视觉的视频帧。

  

论文三:

  

《Time-Contrastive Networks: Self-Supervised Learning from Video》

  

  

对于视频中的每一帧,其实存在着特征相似的概念,可以认为相邻帧特征是相似的,而相隔较远的视频帧是不相似的,通过构建这种position和negative的样本来进行自监督约束。

  

  

对于同一个物体的拍摄是可能存在多个视角(multi-view),对于多个视角中的同一帧,可以认为特征是相似的,对于不同帧可以认为是不相似的。

  

论文四《Unsupervised Learning of Visual Representations Using Videos》

  

  

基于无监督追踪方法,首先在大量的无标签视频中进行无监督追踪,获取大量的物体追踪框。那么对于一个物体追踪框在不同帧的特征应该是相似的,而对于不同物体的追踪框中的特征应该是不相似的。

  

论文五《Shuffle and learn: unsupervised learning using temporal order

  

verification》

  

  

  

基于顺序约束的方法,可以从视频中采样出正确的视频序列和不正确的视频序列,构造成正负样本对然后进行训练。简而言之,就是设计一个模型,来判断当前的视频序列是否是正确的顺序。

  

# 2.3基于对比(Contrastive based)

  

基于对比的约束,通过构建正样本(positive)和负样本(negative),然后度量正负样本的距离来实现自监督学习。核心思想样本和正样本之间的距离远远大于样本和负样本之间的距离。

  

  

  

1\. score 是度量函数,评价两个特征间的相似性。通常称为“ anchor ” 数据。

  

2\. 为了优化 anchor 数据和其正负样本的关系,可以使用点积的方式构造距离函数,然后构造一个 softmax 分类器,以正确分类正样本和负样本。

  

3\. 这应该鼓励相似性度量函数(点积)将较大的值分配给正例,将较小的值分配给负例。

  

论文六 :

  

《Learning deep representations by mutual information estimation and

  

maximization》

  

  

Deep InfoMax 通过利用图像中的局部结构来学习图像表示,对比任务是对一对图像中的全局特征和局部特征进行分类。

  

全局特征是CNN的最终输出,局部特征是编码器中的中间层的输出。每个局部特征图都有一个有限的感受野。

  

对于一个 anchor image ,()是来自一幅图像的全局特征,正样本(+)是相同图像的局部特征,负样本()是不同图像的局部特征。

  

本文探讨的简单思想是训练一个表示学习函数,即编码器,以最大化其输入和输出之间的互信息(MI)。作者以一种类似于对抗自动编码器的方式,将MI最大化和先验匹配结合起来,根据期望的统计特性约束表示。

  

为了得到一个更适合分类的表示,作者将图像的高层表示与局部patch之间的平均MI值最大化。

  

论文七 :

  

《Representation Learning with Contrastive Predictive Coding》

  

  

CPC是一个基于对比约束的自监督框架,可以适用于文本、语音、视频、图像等任何形式数据的对比方法(图像可以看作为由像素或者图像块组成的序列)。

  

CPC通过对多个时间点共享的信息进行编码来学习特征表达,同时丢弃局部信息。这些特征被称为“慢特征”:随时间不会快速变化的特征。比如说:视频中讲话者的身份,视频中的活动,图像中的对象等。

  

CPC 主要是利用自回归的想法,对相隔多个时间步长的数据点之间共享的信息进行编码来学习表示,这个表示 c_t 可以代表融合了过去的信息,而正样本就是这段序列

  

t 时刻后的输入,负样本是从其他序列中随机采样出的样本。CPC的主要思想就是基于过去的信息预测的未来数据,通过采样的方式进行训练。

  

论文八 :

  

Moco《Momentum Contrast for Unsupervised Visual Representation Learning》

  

基于对比的自监督学习其实就是训练一个编码器然后在一个大的字典里确保和对应的key是相似的,和其它的是不相似的。

  

传统上字典的大小就是batch-size,由于算力的影响不能设置过大,因此很难应用大量的负样本。因此效率较低。

  

本文采用队列来存储这个字典,在训练过程中,每一个新batch完成编码后进入队列,最老的那个batch的key出队列,字典的大小与batchsize实现分离,这样可用的字典大小就可以远远大于batchsize,负样本的数目就会大大扩增,效率得到大幅提升。

  

动量更新主要是为了解决字典这部分数据在反向传播的时候更新参数的问题,因为反向传播需要在队列中所有的样本中进行传播。在这里作者使用了一种动量更新的方式缓慢平滑的更新参数:

  

  

  

a) 传统方法-端到端,这种方式query和key用两个encoder,然后两个参数是都进行更新的,但这种方式你的字典大小就是mini-batch的大小。

  

b) 采用一个较大的memery

  

bank存储较大的字典(存储所有的样本),但是每次进行query之后才会对memory进行更新,所以每次采样得到的query可能是很多步骤之前编码的的向量,这样就丢失了一致性。

  

c) 使用queue,每次query之后都删除最早的batch的样本,然后将最新的batch更新入队,这样就巧妙的缓解了memory-

  

bank一致性的问题。同时利用队列可以保存远大于batchsize的样本,这样也解决了end-to-end的batch-size的耦合问题。

  

论文九 : SimCLR《A Simple Framework for Contrastive Learning of Visual

  

Representations》

  

是什么使对比预测任务能够学习有用的表示?

  

1) 数据增强的组合在定义有效的预测任务方面起着关键作用;

  

2) 在表示和对比损失之间引入一个可学习的非线性变换,大大提高了学习表示的质量。

  

3) 与有监督学习相比,对比学习可以从更大的batch和更多的训练步骤中获益。

  

  

取一幅图像对其进行随机变换,得到一对增广图像x_i和x_j。该对中的每个图像都通过编码器以获得图像的表示。然后用一个非线性全连通层来获得图像表示z,其任务是最大化相同图像的z_i和z_j两种表征之间的相似性。

  

随机数据增强模块 :随机剪裁之后Resize到同一尺寸,接着是随机颜色扰动,随机高斯模糊。 随机剪裁和颜色扰动的组合对获得好性能至关重要

  

用于从增强后的数据样本中提取表征向量的神经网络基础编码器。该框架能够无限制的适用不同的网络框架。作者们采用简单通用的ResNet。

  

神经网络projection head g(),用来将表征映射到对比损失应用的空间。

  

对比损失函数 ,用于对比预测任务。给定一个包含正样本对的数据集,对比预测任务目标是识别出正样本对。

  

  

你好,我是对白,硕士毕业于清华,现大厂算法工程师,拿过八家大厂的SSP级以上offer。

  

高中荣获全国数学和化学竞赛二等奖。

  

本科时独立创业五年,成立两家公司, 并拿过总计三百多万元融资(已到账)

  

,项目入选南京321高层次创业人才引进计划。创业做过无人机、机器人和互联网教育,保研后选择退居为股东。

  

我每周至少更新三篇原创,分享自己的算法技术、创业心得和人生感悟。我正在努力实现人生中的第一个小目标, 上方关注后可以加我私信交流 。

  

期待你关注我的公众号,我们一起前行。

  

您的“ 点赞/在看/分享 ”是我坚持的最大动力!

  

坚持不易,卖萌打滚求鼓励 (>ω<>

相关内容

热门资讯

saas系统的商业模式,商业型...   编辑导语:国内SaaS的业务流程,可以说是抗亏的业务流程。如果你依赖客户成功团队或客户成功经理,...
中小板和创业板哪个好,创业板市...   目前,全市场注册制改革准备工作稳步推进,证监会相关监管规则和交易所、协会相关自律规则陆续发布。为...
优秀的商业计划书,懒人用品专卖...   2021年,“新消费”概念受到资本的热烈欢迎,席卷互联网行业和品牌圈。据不完全统计,2021年上...
创业公司融资到d轮,d轮融资的...   世普科技完成了近亿元的A系列融资:一个85后校长的创业故事。      2007年7月27日,为...
农村妇女创业贷款申请书范本,农...         四、申请材料            2.选择衢州市本级,点击材料列表,根据申请人身份...
儿童创业项目大全,适合2-8岁...         1.卖袜子            特别是一些卡通袜更适合孩子,更能吸引孩子的注意力。...
代表大学生的元素,大学生创业l...   “我非常感谢我们的平台推出这项活动。学校学到的东西也可以直接实用。”      程,晋中职业技术...
六安市宜可欧环保科技,六安市科...   本文从六安瓜片工艺的角度,详细讲述了六安瓜片的加工工艺,以及如何正视六安瓜片的加工标准。    ...
中国第三产业比例,上海三产比例...   # 2021年1-3月消费实力前14名城市      1-3月,各大城市消费力(社会消费品零售总...
免费农产品推广平台有哪些,农产...   芜湖宏农电子商务有限公司是安徽飞宇网络科技有限公司在南陵县注册的子公司。通过自营1688电商平台...
创业做什么比较好,创业最开始要...   #你第一次创业时几岁#      我的朋友老吴最近准备在裸辞创业。他曾在一家生产红酒的销售公司工...
2019上海户口落户政策,上海...   在上海定居的方式有很多,但是不太了解政策的人不知道可以采取什么样的定居方式,什么样的定居方式对他...
90后白手起家企业家排行榜,我...         继10月10日《2019 LEXUS雷克萨斯胡润百富榜》发布后,胡润研究院今天发布了...
2021年生意商机,2021年...   没有货源的拼多多店是什么?      首先给大家讲一讲无货源的拼多多和无货源的拼多多,就是开一家...
股价180元的创业板股票,香港...   保荐机构(主承销商):海通证券股份有限公司      投资者应关注发行流程、认购、支付、弃股处置...
会计专业创新项目推荐,会计专业...   7月29日,教育部高等教育司发布《关于首批新文科研究与改革实践项目拟立项项目名单的公示》,山东财...
仲恺的企业,惠州仲恺是做什么的...   9月29日,中国银行惠州陈江支行新址(以下简称“陈江银行”)建成并正式开业,标志着中国银行惠州分...
与合伙人发生矛盾冲突的表现,跟...         白羊星座      爱      本周单身白羊座的感情运势不能算是很顺利。很多白羊座...
全国农村创业创新园区,全国农村...               经过宣传动员      企业独立申报      人、农业和农村等部门  ...
一件代发的货源网站,想创业怎么...   不少新手小白表示,1688批发网存在价格高、质量差、同质化率高等一系列问题。但这是真的。大多数情...