AIAS1

shen/AIAS1

mirror of https://gitee.com/mymagicpower/AIAS.git synced 2024-11-25 16:05:33 +08:00

History

Calvin 458314aa88 更新模型加载说明		2024-11-13 10:21:20 +08:00
..
classification	更新模型加载说明	2024-11-13 10:21:20 +08:00
crowd_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
face_sdks	更新模型加载说明	2024-11-13 10:21:20 +08:00
feature_extraction_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
fire_smoke_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
image_alignment_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
image_colorization_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
image_text_40_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
image_text_sr_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
ocr_sdks	更新模型加载说明	2024-11-13 10:21:20 +08:00
pedestrian_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
seg_sam2_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
seg_unet_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
smart_construction_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
super_resolution_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
vehicle_sdk	更新模型加载说明	2024-11-13 10:21:20 +08:00
README_CN.md	update readme.	2024-10-20 14:01:45 +08:00
README.md	update readme	2024-10-20 16:27:54 +08:00

README.md

项目清单:

1. 1_image_sdks - [图像识别 SDK]

  1). 工具箱系列：图像处理工具箱（静态图像）
  2). 目标检测
  3). 图像分割
  4). GAN
  5). 其它类别：OCR等
      ...

OCR工具箱 1：OCR方向检测与旋转 - ocr_sdks/ocr_direction_det_sdk OCR图像预处理。
OCR工具箱 2：OCR文字识别 - ocr_sdks/ocr_v3_sdk 1. V3 文本检测: - 中文文本检测 - 英文文本检测 - 多语言文本检测 2. V3 文本识别: - 中文简体 - 中文繁体 - 英文 - 韩语 - 日语 - 阿拉伯 - 梵文 - 泰米尔语 - 泰卢固语 - 卡纳达文 - 斯拉夫
OCR工具箱 3：OCR文字识别 - ocr_sdks/ocr_v4_sdk 原生支持旋转倾斜文本文字识别。
OCR工具箱 4：版面分析 - ocr_sdks/ocr_layout_sdk 可以用于配合文字识别，表格识别的流水线处理使用。 1. 中文版面分析 2. 英文版面分析 3. 中英文文档 - 表格区域检测
OCR工具箱 5：表格识别 - ocr_sdks/ocr_table_sdk 中英文表格识别。
OCR工具箱 6： led文字识别 - ocr_sdks/ocr_led_sdk led表盘文字识别。
人脸工具箱 1：人脸检测(含5个人脸关键点) - face_sdks/face_detection_sdk 人脸检测(含5个人脸关键点)提供了两个模型的实现。
人脸工具箱 2：人脸对齐- face_sdks/face_alignment_sdk 根据人脸关键点对齐人脸。
人脸工具箱 3：人脸特征提取与比对- face_sdks/face_feature_sdk 人脸识别完整的pipeline：人脸检测(含人脸关键点) --> 人脸对齐 --> 人脸特征提取 --> 人脸比对
人脸工具箱 4：人脸分辨率提升- face_sdks/face_sr_sdk 包含两个功能： 1.单张人脸图片超分辨。 2.自动检测人脸，然后对齐人脸后提升分辨率。
人脸工具箱 5：图片人脸修复- face_sdks/face_restoration_sdk - 自动检测人脸及关键地，然后抠图，然后根据人脸关键点转正对齐。 - 对所有转正对齐的人脸提升分辨率。 - 使用分割模型提取人脸，逆向变换后贴回原图。
人脸工具箱 6：口罩检测 - face_sdks/mask_sdk 口罩检测，给出检测框。
动物分类识别 - classification/animal_sdk 动物识别sdk，支持7978种动物的分类识别。
菜品分类识别 - classification/dish_sdk 菜品识别sdk，支持8416种菜品的分类识别。
烟火检测 - fire_smoke_sdk 烟火检测，给出检测框和置信度。
行人检测 - pedestrian_sdk 行人检测，给出检测框和置信度。
反光衣检测 - reflective_vest_sdk 实现施工区域或者危险区域人员穿戴检测。
智慧工地检测 - smart_construction_sdk 支持检测的类别：人体，安全帽。
车辆检测 - vehicle_sdk 车辆检测，给出检测框和置信度。
图片特征提取(512维)SDK - feature_extraction_sdk 提取图片512维特征值，并支持图片1:1特征比对，给出置信度。
图像&文本的跨模态相似性比对检索 SDK【支持40种语言】 - image_text_40_sdk -图像&文本特征向量提取 -相似度计算 -softmax计算置信度
图像矫正 - image_alignment_sdk -自动检测边缘，透视变换转正
文本图像超分辨 - image_text_sr_sdk -可以用于提升电影字幕清晰度。
图像超分辨(4倍)- super_resolution_sdk -提升图片4倍分辨率。
黑白图片上色 - image_colorization_sdk -应用到黑白图像中，从而实现黑白照片的上色。
一键抠图工具箱 - 1. 通用一键抠图 - seg_unet_sdk -包括三个模型：满足不同精度，速度的要求。
一键抠图工具箱 - 2. 动漫一键抠图 - seg_unet_sdk 无需手动绘制边界，大大提高了抠图的效率和精准度。应用场景如： - 广告设计 - 影视后期制作 - 动漫创作等
一键抠图工具箱 - 3. 衣服一键抠图 - seg_unet_sdk 衣服一键抠图应用场景可以在很多方面发挥作用，以下是一些简要介绍： - 电子商务 - 社交媒体 - 广告设计 - 时尚设计 - 虚拟试衣
一键抠图工具箱 - 4. 人体一键抠图 - seg_unet_sdk -人体一键抠图可以将人体从背景中抠出，形成一个透明背景的人体图像。

README.md Unescape Escape

项目清单:

README.md