Microsoft Cloud OCR

Описание

Распознает текст с картинки при помощи Microsoft OCR.

Параметры

Путь к файлу

  1. Задать значение: позволяет в явном виде задать путь к файлу. При нажатии на кнопку "Выбрать" можно указать путь вручную с использованием проводника.

  2. Сохранить результат предыдущего шага: в качестве пути берет результат действия из предыдущего шага workflow.

  3. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для задания пути.

Поддерживаемые форматы файлов:

  • jpg

  • png

  • bmp

  • gif

Максимальный размер файла: 4 МБ

Размер изображения: от 50х50 пикселей до 4200х4200 пикселей, но не более 10 мегапикселей

Область распознавания

Если выбрать опцию "Использовать область распознавания", то робот будет распознавать текст внутри заданной прямоугольной области. Чтобы задать область, нужно задать левый верхний угол прямоугольника и его длину и ширину.

X

  1. Задать значение: позволяет указать координату левого верхнего угла по горизонтальной оси.

  2. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для вычисления координаты.

Y

  1. Задать значение: позволяет указать координату левого верхнего угла по вертикальной оси.

  2. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для вычисления координаты.

Ширина

  1. Задать значение: позволяет указать ширину прямоугольной области.

  2. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для задания ширины.

Высота

  1. Задать значение: позволяет указать высоту прямоугольной области.

  2. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для задания высоты.

Комментарий

Позволяет добавить поясняющий текст к блоку. Текст будет отображаться внутри блока сверху от названия функции.

Результат

Для сохранения результата в переменную необходимо к данному действию присоединить действие "Задать значение переменной", указать желаемое имя переменной и отметить пункт "Сохранить результат предыдущего шага".

Результатом является массив объектов вида "ключ-значение". Один объект содержит следующие ключи и значения:

Поля одного объекта из массива объектов переменной после распознавания
Поля одного объекта из массива объектов переменной после распознавания
{
"text": "распознанное слово",
"location": {
"y": "координата y левого верхнего угла прямоугольной области с текстом",
"x": "координата x левого верхнего угла прямоугольной области с текстом",
"width": "ширина прямоугольной области, содержащей распознанное слово",
"height": "высота прямоугольной области, содержащей распознанное слово"
},
"language": "язык документа"
}

Рекомендации к использованию

Данное действие может быть удобным в RPA-процессах, где требуется также знать, в какой области находится тот или иной текст. Поскольку возвращается не только само слово, но и его координата, то это также можно использовать в соответствующих целях.