机器人的寒武纪要来了?(脸书发布机器视觉大模型—SAM)

  近来,Meta AI发布了根底模型 Segment Anything Model(SAM)并开源,其本质是用GPT的方法(依据Transform 模型架构)让计算机具有理解了图画里边的一个个“目标”的通用才能。SAM模型建立了一个可接受文本提示、依据海量数据练习而取得泛化才能的图画切割大模型。这些特征在无人驾驶(检测其他轿车、行人与障碍物)、医学成像(提取特定结构或潜在病灶)等使用中特别重要。

  依据美国制作工程师协会机器视觉分会和美国机器人工业协会自动化视觉分会对机器视觉的界说,机器视觉是经过光学的设备和非触摸的传感器,自动地接纳和处理一个实在物体的图画,以取得所需信息或用于操控机器人运动的设备。

  机器视觉职业的上游包含相机、镜头、光源等硬件及算法软件;机器视觉职业的中游为视觉体系与智能配备;机器视觉职业的下流为各职业集成使用和服务。一个典型的机器视觉使用体系包含图画捕捉、光源体系、图画数字化模块、数字图画处理模块、智能判别决议计划模块和机械操控履行模块。

  从全球机器视觉商场来看,机器视觉商场包含视觉器材、可配备视觉体系和智能视觉配备三个细分商场。依据前瞻工业研究院陈述,机器视觉工业链全体可分为底层开发商(中心零部件和软件提供商)、集成和软件服务商(二次开发),其间中心零部件及软件包含光源、镜头、工业相机、图画采集卡、图画处理软件等。在现在的整个机器视觉体系本钱构成上,中心零部件及软件开发占有了80%的份额,是工业链中的中心环节。

  5亿年前,感光细胞的发生催生了寒武纪的生物大迸发。当下眼睛成为绝大部分生物赖以生存的重要东西,但只要一个眼球是什么也看不到的,由于视觉传感器和其它传感器不一样。视觉的发生是需求大脑完结处理的,可以说眼睛不仅仅是个器官,它其实是大脑的一部分。而今日视觉大模型SAM的发布正如五亿年前的感光细胞,它正带领咱们感触即将来临的机器智能的年代光辉!

其他人还喜欢