数据分析师-数据挖掘与机器学习-计算机视觉_图像分割技术.docxVIP

数据分析师-数据挖掘与机器学习-计算机视觉_图像分割技术.docx

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

PAGE1

PAGE1

计算机视觉基础

1图像的基本概念

在计算机视觉领域,图像被视为由像素组成的二维矩阵。每个像素包含颜色信息,通常以RGB(红、绿、蓝)或灰度值表示。图像的分辨率由其宽度和高度的像素数量决定,例如,一个640x480的图像意味着它由640列和480行的像素组成。

2像素与图像坐标系

像素是图像的基本单位,每个像素在图像坐标系中都有一个唯一的坐标。坐标系的原点通常位于图像的左上角,x轴向右,y轴向下。例如,像素(0,0)位于图像的左上角,而像素(639,479)在640x480图像中位于右下角。

3图像处理技术简介

图像处理技术是计算机视觉的基础,包括图像增强、图像恢复、图像压缩、图像分割等。其中,图像增强通过调整图像的对比度、亮度或颜色来改善图像质量;图像恢复旨在从模糊或噪声图像中恢复原始图像;图像压缩用于减少图像存储或传输所需的比特数;图像分割则是将图像划分为多个区域,每个区域具有相似的属性,如颜色、纹理或形状。

3.1示例:图像增强-调整亮度和对比度

importcv2

importnumpyasnp

#读取图像

img=cv2.imread(example.jpg,cv2.IMREAD_COLOR)

#调整亮度

brightness=50

img_bright=np.clip(img+brightness,0,255).astype(np.uint8)

#调整对比度

contrast=1.5

img_contrast=np.clip(img*contrast,0,255).astype(np.uint8)

#显示原图和处理后的图像

cv2.imshow(OriginalImage,img)

cv2.imshow(BrightImage,img_bright)

cv2.imshow(ContrastImage,img_contrast)

#等待按键并关闭窗口

cv2.waitKey(0)

cv2.destroyAllWindows()

3.2示例:图像分割-使用K-means聚类

importcv2

importnumpyasnp

fromsklearn.clusterimportKMeans

#读取图像并转换为二维数组

img=cv2.imread(example.jpg,cv2.IMREAD_COLOR)

img=img.reshape((img.shape[0]*img.shape[1],3))

#使用K-means聚类进行图像分割

kmeans=KMeans(n_clusters=5)

kmeans.fit(img)

labels=kmeans.predict(img)

#将聚类结果转换回图像格式

img_segmented=np.zeros_like(img)

foriinrange(5):

img_segmented[labels==i]=kmeans.cluster_centers_[i]

img_segmented=img_segmented.reshape((img.shape[0],img.shape[1],3)).astype(np.uint8)

#显示原图和分割后的图像

cv2.imshow(OriginalImage,img.reshape((img.shape[0],img.shape[1],3)))

cv2.imshow(SegmentedImage,img_segmented)

#等待按键并关闭窗口

cv2.waitKey(0)

cv2.destroyAllWindows()

4计算机视觉的历史与发展

计算机视觉的起源可以追溯到20世纪50年代,当时的研究主要集中在图像处理和模式识别上。随着计算机硬件和算法的发展,计算机视觉在90年代开始迅速发展,出现了许多重要的算法和技术,如SIFT、SURF、HOG等。近年来,深度学习技术的兴起,尤其是卷积神经网络(CNN),极大地推动了计算机视觉的发展,使其在图像分类、目标检测、图像分割等领域取得了突破性的进展。

4.1示例:使用深度学习进行图像分类

importtensorflowastf

fromtensorflow.keras.preprocessingimportimage

fromtensorflow.keras.applications.resnet50importpreprocess_input,decode_predictions

importnumpyasnp

#加载

您可能关注的文档

文档评论(0)

kkzhujl + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档