pie-749-blanco

corpha.ec

Corpus del Habla del Ecuador (CORPHA)

Para utilizar el Corpus del Habla del Ecuador presione aquí o en la imagen.

Portada del Corpus del Habla del Ecuador

El Corpus del Habla del Ecuador (alojado en corpha.ec) es un corpus sincrónico y diatópico del español de nuestro país que está en línea —y disponible al público— desde el 7 de julio de 2016. Contiene textos escritos por personas de nacionalidad ecuatoriana e incluye obras literarias, publicaciones de prensa y artículos de páginas web que datan desde 1900 hasta la actualidad.

La recolección de datos se realiza mediante el escaneo y posterior procesamiento de las fuentes en formato tradicional impreso, así como a través de la recolección y organización de documentos en formato digital. Esta actividad se realiza con la colaboración de estudiantes de la carrera de Lingüística de la Pontificia Universidad Católica del Ecuador como parte de sus prácticas preprofesionales.

Objetivo

Ante todo, el CORPHA tiene como objetivo enriquecer el conocimiento que tenemos los ecuatorianos sobre la variedad del español hablada en nuestro país. Concretamente, pretende reflejar el contexto en el que se utiliza nuestra lengua e intenta ser un modelo de nuestra realidad lingüística, mostrando el uso que sus hablantes hacen de ella.

Funcionamiento

El CORPHA tiene entre sus prestaciones la posibilidad de búsquedas autorales, históricas, geográficas, textuales y temáticas, sean estas realizadas en forma independiente, combinada o simultánea. Esta búsqueda se puede realizar desde la página principal.

Por el momento, el corpus no cuenta con operadores o símbolos de búsqueda, por lo que se mostrarán solamente las coincidencias exactas con el término consultado.

Características

El CORPHA tiene tres características principales: (1) indica el número de coincidencias del término consultado, (2) permite ver el contexto que acompaña al lema consultado y (3) ofrece una plantilla de metadatos de cada documento.

1. Número de coincidencias

Al buscar un término en el CORPHA, el primer dato que se muestra es el número de documentos que lo contienen y, posteriormente, el número de veces que consta en dicho documento. Se muestran 10 documentos por página.

2. Contexto textual

El CORPHA muestra el término en contexto, con al menos 10 palabras antes y después.

3. Metadatos

Al momento de ingresar un documento al CORPHA se registran los siguientes datos:

  • Autor: Corresponde al nombre del autor del documento
  • Título de la obra: Es el título del documento original (publicado o inédito).
  • Fecha de publicación: Es el año en que fue publicado el documento.
  • Región: Corresponde a una de las 6 regiones en las que se dividió el territorio ecuatoriano para este propósito (Amazonía, Austro, Costa, Galápagos, Loja, Sierra Centro y Sierra Norte).
  • Soporte: Corresponde a la clasificación tipológica textual del documento (Libro, Prensa y Miscelánea y web).
  • Temática: Es el tópico o la materia principal de la que trata el documento (Actualidad, ocio y vida cotidiana, Arte cultura y espectáculo, Ciencia y tecnología, Ciencias sociales, creencias y pensamiento, Deporte, Ficción [Novela, Retrato o Teatro], Gastronomía, Política, economía y justicia y Salud).
  • Edición: Corresponde al número de edición (en Libros) o a la fecha exacta de publicación (en Prensa y Miscelánea y web).

Al consultar un término en el buscador, se muestran algunos de estos datos en la parte inferior de cada documento.

Utilidad

En un principio, el CORPHA fue ideado con el objetivo de ser la fuente principal de datos del Diccionario académico del habla del Ecuador (DAHE) en cuanto a la selección del lemario, la detección y organización de acepciones y subacepciones, la extracción de entornos sintácticos y, sobre todo, la elección de ejemplos reales para la ilustración de significados. Así, la comisión de lexicografía de la Academia Ecuatoriana de la Lengua utiliza diariamente el CORPHA para buscar ejemplos naturales, informativos e inteligibles que completen las entradas de su naciente diccionario.

Además, el CORPHA puede ser usado en muchas otras actividades. Por su especificidad, permite estudiar y matizar fenómenos lingüísticos que hasta ahora estaban faltos de suficiente evidencia documental. Asimismo, constituye una base sólida para hacer una gramática comprehensiva del español hablado en nuestro país, permitiendo profundizar en la dialectología interna de todas nuestras regiones. Finalmente, al contener numerosos documentos de diverso tema y naturaleza, posibilita estudiar o repensar fenómenos sociales, históricos y culturales —entre muchos otros— de nuestro país.

Para utilizar el Corpus del Habla del Ecuador presione aquí.