Menu
inlocrobotics_logo
INLOC Robotics
    • SEWDEF
    • Ingeniería
    • Planes
    • Sobre nosotros
    • Blog
    • Contacto
    • EspañolEspañol
      • EspañolEspañol
      • CatalàCatalà
      • EnglishEnglish
    Close Menu
    Detección de texto
    febrero32021

    Segmentación y decodificación de texto en una imagen

    En el mundo de la visión por computador es muy común encontrarse con imágenes donde entre otros objetos o ambientes, también aparece texto. En ocasiones, es de especial interés poder leerlo, por lo que su segmentación del resto de la imagen es de gran importancia.

    El grado de dificultad de la detección del texto varía mucho según el ambiente. Es decir, no es lo mismo detectar texto en un “ambiente controlado” donde se sabe dónde está el texto y éste está claramente diferenciado del resto de la imagen, que en un “natural environment”. En este último interfieren una serie de factores que dificultan en gran medida la segmentación del texto, como puede ser el ruido de la cámara con el que se obtiene la imagen, la mala iluminación de la escena o los frames borrosos que se dan, por ejemplo, si la cámara no tiene estabilidad.

    Además de los problemas ya comentados, también está presente la dificultad de localizar el texto dentro de la imagen ya que puede aparecer en diferentes posiciones y orientaciones. Una vez localizado, cada carácter debe ser segmentado cuidadosamente para así poder obtener una lectura correcta del texto.

     

    Detección de texto en una imagen

    Como ya se ha comentado anteriormente, el primer desafío al que enfrentarse en la segmentación de texto es la localización del mismo. De entre los diferentes posibles métodos para conseguir este objetivo, en este artículo se usará el EAST Detector.

     

    Toma de datos de alcantarillado

    El EAST Detector es capaz de detectar texto prácticamente en real time (13 fps) tanto en imágenes como en videos ya sea en texto horizontal o rotado utilizando una convolutional neural network.

    Con respecto a otros posibles algoritmos, el EAST Detector ha suprimido pasos intermedios innecesarios de forma que únicamente cuenta con dos etapas. La primera de ellas es la predicción de líneas de texto o palabras usando la red neuronal y la segunda es el procesado de las predicciones.

    En la Figura superior se puede ver un ejemplo de las diferentes regiones con texto que han sido detectadas por el algoritmo, cada una de ella marcada con un recuadro verde.

     

    Decodificación del texto

    Una vez se ha detectado la localización del texto, se procede a la decodificación del mismo. Para ello, es importante poder aislar de la mejor manera posible los caracteres del fondo de la imagen, de modo que se deben aplicar diferentes operaciones morfológicas para lograrlo. Estas operaciones dependen del ambiente con el que se está trabajando y lo mejor es evaluar individualmente cada caso para decidir cuáles deben ser aplicadas. La Figura inferior presenta un ejemplo de este paso.

     

    Decodificación de texto

    Una vez el texto ha sido aislado del fondo de la imagen, existen diferentes métodos para poder realizar su lectura. En este caso se ha optado por usar la librería Tesseract OCR, la cual es un motor para el reconocimiento óptico de caracteres.

     

    Así pues, la combinación del EAST Detector junto con la librería Tesseract proporcionan un método bastante robusto mediante el cual se puede detectar la posición texto y realizar una lectura del mismo para el posterior tratamiento de estos datos.

     

    Hay diferentes opciones que permiten afinar más el reconocimiento de caracteres. Por ejemplo, es posible indicar el idioma en que se encuentra el texto o si se trata de caracteres alfanuméricos o de números o letras en exclusiva.

    Colaboración proyecto ASIR: Navegación autónoma de robots en alcantarillado Lector de huella digital

    Related Posts

    Lector de huella digital

    Lector de huella digital

    Colaboración proyecto ASIR

    Colaboración proyecto ASIR: Navegación autónoma de robots en alcantarillado

    Nube de Puntos

    Detección e inferencia de objetos usando una nube de puntos con cámara 3D

    Back To Top
    INLOC Robotics
      • Aviso legal
      • Política de privacidad
      • Política de cookies
      © INLOC Robotics 2021
      Esta web utiliza cookies propias y de terceros para optimizar y adaptarse a tu navegación y preferencias, entre otras tareas. Si continuas navegando, entenderemos que aceptas nuestra política de privacidad.
      Más información...Aceptar
      Privacy & Cookies Policy

      Privacy Overview

      This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
      Necesarias
      Siempre activado

      Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.

      No necesarias

      Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.