Перейти до основного
Перекладач
Ця сторінка була автоматично переведена на службу машинного перекладу Microsoft перекладача. Дізнатися більше

Microsoft Перекладач блог

Перекладайте відскановані PDF-документи за допомогою перекладу документів

Телефон, який використовується для зйомки зображення документа.

Сьогодні, Переклад документів функція Translator, когнітивної служби Microsoft Azure, додає можливість перекладу PDF-документів, що містять відсканований вміст зображення, усуваючи необхідність для клієнтів попередньо обробляти їх через рушій розпізнавання перед перекладом.

Переклад документів був широко доступний минулого року, 25 травня 2021 року, що дозволило клієнтам перевести цілі документи та партії документів у більш ніж 110 мов і діалектів збереження макета та форматування вихідного файлу. Переклад документів підтримує різні типи файлів, включаючи Word, PowerPoint і PDF, і клієнти можуть використовувати як попередньо побудовані, так і власні моделі машинного перекладу. Переклад документів готовий до підприємства з автентифікацією Azure Active Directory, забезпечуючи захищений доступ між службою та сховищем через кероване посвідчення.

Переклад PDF-файлів зі відсканованим вмістом зображення є дуже затребуваною функцією від клієнтів перекладу документів. Клієнтам важко відокремити PDF-документи, які мають звичайний текст або відсканований вміст зображення за допомогою автоматизації. Це створює проблеми з робочим процесом, оскільки клієнти повинні спочатку направити PDF-документи з відсканованим вмістом зображення до обробника розпізнавання, перш ніж надсилати їх у переклад документів.

Послуги перекладу документів тепер мають розвідку

  • щоб визначити, чи містить документ PDF відсканований вміст зображення чи ні,
  • для маршрутизації PDF-файлів, що містять відсканований вміст зображення, до двигуна розпізнавання всередині для вилучення тексту,
  • реконструювати перекладений вміст у форматі звичайного текстового PDF, зберігаючи при цьому вихідний макет і структуру.

Форматування шрифтів, як жирний шрифт, курсив, підкреслення, світлі тони тощо, не зберігається для відсканованого вмісту PDF, оскільки технологія розпізнавання наразі їх не фіксує. Однак форматування шрифтів зберігається під час перекладу звичайного тексту PDF-документів.

Переклад документів наразі підтримує PDF-документи, що містять відсканований вміст зображення з 68 мов джерел на 87 цільових мов. Підтримка додаткових вихідних і цільових мов буде додана в належний час.

Тепер клієнтам простіше надіслати всі PDF-документи безпосередньо в переклад документів і дозволити йому вирішити, коли і як ефективно використовувати движок розпізнавання.

Для клієнтів, які вже використовують переклад документів, не потрібно змінювати код, щоб мати можливість використовувати цю нову функцію. PDF-документи зі відсканованим вмістом можна надсилати для перекладу, як і будь-які інші підтримувані формати документів.

Ми також раді повідомити, що переклад документа додає підтримку відсканованого вмісту PDF-документа без додаткових витрат для клієнтів. Для перекладу документів через Azure доступні два тарифні плани — тарифний план Pay-as-you-go і тарифний план обсягу D3 для більших обсягів перекладу документів. Детальну інформацію про ціни можна знайти за адресою aka.ms/TranslatorPricing.

Дізнайтеся, як розпочати роботу з перекладом документів за адресою aka.ms/DocumentTranslationDocs.
Надсилання відгуку mtfb@microsoft.com.