目前,许多组织或机构已经定义了机器视觉,但范围和内涵不同。从事机器视觉技术研发和应用的人员容易造成概念混淆和边界模糊,需要进一步明确机器视觉的概念内涵和工业边界。在这里,对几个典型的定义进行了阐述和分析。
百度百科给出了定义“机器视觉是人工智能快速发展的一个分支。简单来说,机器视觉就是用机器代替人眼来测量和判断。机器视觉系统是通过机器视觉产品(CMOS和CCD)将被摄目标转换为图像信号,传输到特殊的图像处理系统,获取被摄目标的形式信息,根据像素分布、亮度、颜色等信息转换为数字信号;图像系统对这些信号进行各种计算,以提取目标的特征,然后根据识别结果控制现场的设备动作。”维基百科提出“机器视觉是为工业自动检测、过程控制、机器人指导等应用提供基于图像的自动检测和分析的技术和方法。”百度百科认为机器视觉是人工智能的一个分支,而维基百科更强调其独立性。以上两个定义对机器视觉的定位并不全面,技术范围也不统一。
AIA全球视觉与成像协会(AIA)机器视觉的定义是“机器视觉是利用相机和计算机代替人的视觉感知和判断能力来执行测试任务。它自动收集和分析图像,以获取控制或评估特定部件或活动所需的数据”,并在机器视觉市场报告中提到“我们所说的机器视觉是指所有的工业和非工业应用程序,在这些应用程序中,硬件和软件的结合为设备提供操作指导,使其能够基于图像捕捉和处理来执行其功能”。这种定义范围太宽,边界模糊,没有反映机器视觉的根本特征。
美国制造工程师协会(SME)机器视觉分会和美国机器人工业协会(RIA)自动视觉分支,机器视觉定义为“机器视觉是通过光学装置和非接触式传感器自动接收和处理真实物体图像,以获得控制机器人运动所需信息的装置。机器视觉技术主要采用适合被测物体的多角度光源和传感器,通过计算机从图像中提取信息,进行分析和处理,终用于实际检测和控制。机器视觉是机械、电子、光学、自动控制、人工智能、计算机科学、图像处理和模式识别等领域的交叉学科。”在其定义中,视觉检测的控制对象被定义为机器人运动,适用于协会领域,但作为一个普遍定义有点偏颇。湖南大学凌志刚教授定义了《图学学报》发表的《机器视觉技术研究进展与展望》一文,即“机器视觉是一门基于计算机视觉理论工程的学科,涉及光学成像、视觉信息处理、人工智能和机电一体化。”将机器视觉定义为一门学科,只描述其技术构成,而不提其基本特征和内涵。卡迪夫大学BruceG.Batchelor教授在2012年的《MachineVisionHandbook》还有机器视觉的定义“机器视觉涉及光电-机械-电子系统的分析和设计,通过探测电磁辐射的时空模式来感知环境,然后处理数据来执行有用的实用功能。”该定义将机器视觉分为感知、处理和执行三个过程,行业认可度相对较高。
机器视觉系统是集光学、机械、电子、计算、软件等技术于一体的工业应用系统。通过探测和感知电磁辐射的时空模式,可以自动获取一个或多个目标对象的图像,处理、分析和测量获得的图像的各种特征量,并根据测量结果进行定性分析和定量解释,从而获得对目标对象的一定认识,并做出相应的决策,实施能够直接创造经济价值或社会价值的功能活动。机器视觉系统一般具有物体定位、特征检测、缺陷判断、目标识别、计数和运动跟踪等功能。
生动地说,机器视觉的本质是植入机器“眼睛”和“大脑”。植入器植入眼睛代表机器视觉利用环境和物体对光的反射来获取和感知信息;将机器植入大脑意味着机器视觉需要智能处理和分析信息,并应用分析的结果来执行相应的活动。
从定义上看,机器视觉主要包括三个关键环节,即1)成像,即利用光准确客观地感知环境;2)信号分析和处理,即智能分析和理解获得的信息;3)决策和执行,即应用分析结果的决策和实际行动。对于一个完整的机器视觉系统,必须综合利用光源照明、光路设计、传感成像、模拟和数字信号处理、数字图像处理、计算机视觉、机械工程、控制和人机接口等一系列技术,依次实现上述三个关键环节。
联系电话:150-2003-5767
企业邮箱:qdhaoke@163.com
公司地址:青岛城阳区春阳路119号国家
质量基础设施基地1号楼1007