Yandex Cloud OCR

Описание

Распознает текст с картинки при помощи Yandex OCR.

Параметры

Путь к файлу

  1. Задать значение: позволяет в явном виде задать путь к файлу. При нажатии на кнопку "Выбрать" можно указать путь вручную с использованием проводника.

  2. Сохранить результат предыдущего шага: в качестве пути берет результат действия из предыдущего шага workflow.

  3. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для задания пути.

Поддерживаемые форматы файлов:

  • pdf

  • jpg

  • png

Максимальный размер файла: 1 МБ

Максимальный размер изображения: 20 мегапикселей (длина × ширина)

Область распознавания

Если выбрать опцию "Использовать область распознавания", то робот будет распознавать текст внутри заданной прямоугольной области. Чтобы задать область, нужно задать левый верхний угол прямоугольника и его длину и ширину.

X

  1. Задать значение: позволяет указать координату левого верхнего угла по горизонтальной оси.

  2. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для вычисления координаты.

Y

  1. Задать значение: позволяет указать координату левого верхнего угла по вертикальной оси.

  2. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для вычисления координаты.

Ширина

  1. Задать значение: позволяет указать ширину прямоугольной области.

  2. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для задания ширины.

Высота

  1. Задать значение: позволяет указать высоту прямоугольной области.

  2. Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для задания высоты.

Комментарий

Позволяет добавить поясняющий текст к блоку. Текст будет отображаться внутри блока сверху от названия действия.

Результат

Для сохранения результата в переменную необходимо к данному действию присоединить действие "Задать значение переменной", указать желаемое имя переменной и отметить пункт "Сохранить результат предыдущего шага".

Результатом является массив объектов вида "ключ-значение". Один объект содержит следующие ключи и значения:

Поля одного объекта из массива объектов переменной после распознавания
Поля одного объекта из массива объектов переменной после распознавания
{
"text": "распознанное слово",
"location": {
"y": "координата y левого верхнего угла прямоугольной области с текстом",
"x": "координата x левого верхнего угла прямоугольной области с текстом",
"width": "ширина прямоугольной области, содержащей распознанное слово",
"height": "высота прямоугольной области, содержащей распознанное слово"
},
"language": "язык, на котором написано распознанное слово"
}

Рекомендации к использованию

Данное действие может быть удобным в RPA-процессах, где требуется также знать, в какой области находится тот или иной текст. Поскольку возвращается не только само слово, но и его координата, то это также можно использовать в соответствующих целях.