你将了解 Azure AI 搜索中的技能组如何通过添加光学字符识别 (OCR)、图像分析语言检测文本翻译实体识别,在搜索索引创建可搜索文本的内容

关注TechLead分享AI全维度知识作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员阿里认证的资深架构师项目管理专业人士,上亿营收AI产品研发负责人。

file

环境准备

开始之前,必须具备以下先决条件

设置数据

在以下步骤中,在 Azure 存储中设置 blob 容器存储异类内容文件

  1. 下载示例数据,其中包括不同类型的小型文件集。 解压缩文件

  2. 使用 Azure 帐户登录Azure 门户

  3. [创建 Azure 存储帐户]或[查找现有帐户]。

  4. 在 Azure 门户中,打开 Azure 存储页并创建容器可以使用默认公共访问级别

  5. 在容器中选择上传”以上传第一个步骤下载示例文件。 请注意,内容类型非常广泛,包括无法以本机格式进行全文搜索的图像应用程序文件。
    file

现在,你已准备好继续运行导入数据向导

运行导入数据”向导

  1. 使用 Azure 帐户登录Azure 门户

  2. 查找搜索服务,并在“概述”页中,选择命令栏上的“导入数据”,通过四个步骤设置认知扩充。
    file

步骤 1:创建数据源

  1. 在“连接到数据”中,选择“Azure Blob 存储” 。

  2. 选择存储帐户现有连接然后选择你创建的容器。 为数据源命名,并对余下的设置使用默认值
    file
    继续转到下一页

如果收到“从数据源检测索引架构出错”,则说明支持向导索引器无法连接数据源数据源可能具有安全保护尝试以下解决方案然后重新运行向导

步骤 2:添加认知技能

接下来配置 AI 扩充来调用 OCR、图像分析自然语言处理

  1. 对于本快速入门我们使用免费的 Azure AI 服务资源。 示例数据包括 14 个文件,因此,Azure AI 服务免费提供的 20 个事务配额足以完成本快速入门
    file
  2. 展开添加扩充”,并做出六项选择

启用 OCR,将图像分析技能添加向导页。

选择实体识别(人员组织位置)和图像分析技能(标记字幕)。

file
继续转到下一页

步骤 3:配置索引

索引包含可搜索的内容,“导入数据”向导通常可以通过对数据源采样来创建架构。 在此步骤查看生成的架构,并根据情况修改任何设置。 以下是为演示 Blob 数据集创建的默认架构。

在本快速入门中,向导能够很好地设置合理默认值

继续转到下一页

步骤 4:配置索引

索引驱动索引过程。 它指定数据源名称目标索引和执行频率。 “导入数据”向导将创建多个对象,包括一个可以重置重复运行的索引器。

  1. 在“索引器”页中,可以接受默认名称并选择“一次”来立即运行该索引器。
    file
  2. 选择“提交”以创建并同时运行索引器。

监视状态

与典型的基于文本的索引相比,认知技能索引编制需要花费更长的时间才能完成,OCR 和图像分析尤其如此。 若要监视进度,请转到“概述”页,然后选择页面中间的“索引器”。
file
若要查看有关执行状态详细信息,请从列表中选择一个索引器,然后选择“成功”(或“失败”)以查看执行详细信息

在此演示中,有一条警告"Could not execute skill because one or more skill input was invalid."。该警告表示数据源中的 PNG 文件不向实体识别提供文本输入。 出现此警告是因为上游 OCR 技能无法识别图像中的任何文本,因此无法为下游实体识别技能提供文本输入

警告在技能组执行中很常见。 随着你熟悉技能循环访问数据的方式,你可能开始发现规律并了解哪些警告是可以安全忽略的。

搜索浏览器中的查询

创建索引后,请在“搜索浏览器”中运行查询返回结果

  1. 在搜索服务仪表板页上,选择命令栏上的“搜索浏览器”。

  2. 选择顶部的“更改索引”,选择创建的索引。

  3. 输入要在其中查询索引的搜索字符串例如 search=Satya Nadella&$select=people,organizations,locations&$count=true

随后会返回详细的 JSON 格式的结果,这些结果可能难以阅读,尤其是在大型文档中。 在此工具中搜索时,可以借鉴一些提示,其中包括以下技术

查询字符串区分大小写,因此如果收到“未知字段”消息,请检查“字段”或“索引定义(JSON)”以验证名称大小写
file

关注TechLead分享AI全维度知识作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员阿里认证的资深架构师项目管理专业人士,上亿营收AI产品研发负责人。

原文地址:https://blog.csdn.net/magicyangjay111/article/details/134756204

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_33996.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注