...

Calfa OCR
Dédié aux langues orientales et aux manuscrits

Utilisez des modèles d'IA pour extraire en un clin d'œil les textes et données de vos documents papiers, archives ou livres et leur offrir un nouveau potentiel.

Des modèles génériques puissants pour la reconnaissance de texte en arabe et arménien

Pour vos traitements de documents imprimés ou manuscrits simples en écriture arabe ou arménienne, nos modèles d'IA généralistes prêts à l'emploi vous offrent d'excellentes performances pour un coût économique. Essayez-les en ligne.

Création de modèles personnalisés capables de traiter les corpus les plus complexes

Pour tous les corpus en langue non-occidentale, en dialecte ou d'une main complexe : obtenez une reconnaissance de texte automatique d'une qualité inégalable grâce à un modèle d'IA personnalisé.

Nos offres d'OCR/HTR

Modèles génériques

Direct OCR/HTR

Traitement immédiat de vos documents simples par nos modèles d'IA génériques

Traitement

À la page
TXT et XML

Modèles personnalisés

Forfait Recherche


Importez vos données ou créez-les en ligne

Développement

1 modèle personnalisé sur votre corpus

Traitement

3500 pages incluses
TXT et XML

Modèles personnalisés

Projet personnalisé

Création des données

Par nos experts selon votre cahier des charges

Développement

Modèles personnalisés sur chacun de vos besoins

Traitement

Grands volumes
Formatage personnalisé

Démonstrations

Reconnaissances des écritures les plus complexes

de 95% à 99% en moyenne

Détection et analyse de la mise en page

Les titres, sous-titres, notes... sont détectés et étiquetés

Texte courbe ou vertical

Prise en charge native de toutes les variations d'orientation

Scans bruités, pages endommagées

Nous les traitons grâce à un entraînement spécifique

Alphabets mélangés, documents multilingues

Gestion d'alphabets multiples au sein d'un même document

De droite à gauche, gauche à droite, haut en bas...

Intégration de tous les sens de lecture

Cas d'usage

Essayez Calfa OCR/HTR

Bénéficiez de 20 pages offertes pour tester notre reconnaissance de texte en arabe et en arménien.

Tester la démo en ligne

Caractéristiques techniques

Langues prises en charge

Ecritures arabes Arménien Chinois Hébreu Géorgien Syriaque Grec ancien Grec moderne ...

Autres langues sur demande.

Fonctionnalités

  • Reconnaissance des écritures complexes (manuscrits et imprimés)
  • Détection de la mise en page
  • Classification sémantique et mots-clés automatiques
  • Textes courbés, verticaux, lignes coupées, pages dégradées
  • Alphabets mélangés et documents multilingues
  • Données en entrée

    • PDF
    • Fichier image (JPG, PNG, TIFF etc.)
    • Couleur ou N&B
    • Serveur IIIF

    Données en sortie

  • TXT, DOC, ODT, PDF
  • Serveur IIIF
  • PDF avec texte en surimpression
  • ALTO
  • PageXML
  • Autres sur demande
  • Questions fréquentes

    Calfa OCR est spécialement conçu pour reconnaître les textes écrits à la main. Le plus ancien manuscrit que nous avons traité date du Ve siècle, le plus récent du XXe siècle.

    Pour l'arménien, l'arabe et le grec, nos modèles génériques fonctionnent sur de nombreux types et styles d'écriture. Pour les mains plus complexes ou les autres langues, un modèle personnalisé peut être nécessaire pour obtenir un bon niveau de reconnaissance.

    Le taux de reconnaissance est le pourcentage de caractères correctement reconnus par l'OCR. Lors d'un processing avec nos modèles génériques, il est très variable selon le style d'écriture, l'état du support ou la qualité du scan.
    Les modèles personnalisés nous permettent en moyenne d'atteindre une bonne reconnaissance de 92% à 99%.
    Nous vous invitons à nous envoyer vos documents pour une estimation du taux de reconnaissance que Calfa OCR peut vous fournir.

    Oui, Calfa OCR fonctionne sur les documents imprimés comme les pages de journal, les livres, les documents tapés à la machine, etc., pour toutes les langues prises en charge.