Está há cerca de um mês disponível na Internet o Corpus do Português, um trabalho de dois investigadores de universidades norte-americanas que se basearam numa série gigantesca de estudos e documentos sobre a língua, quer históricos quer actuais, nomeadamente de jornais nacionais e regionais, de Portugal e do Brasil.
O sítio permite pesquisar mais de 45 milhões de palavras em mais de 50.000 textos em português: palavras exactas ou frases, lemas, classes gramaticais, ou qualquer combinação dos itens anteriores. Proporciona também a pesquisa de palavras vizinhas (collocates) com um máximo de dez palavras de cada lado.
O corpus também facilita a comparação da frequência e distribuição de palavras, frases e construções gramaticais através de textos, através de três processos:
- Registo: comparações entre o falado, a ficção, o jornalístico, e o acadêmico
- Dialecto: Portugal versus Brasil no século XX
- Período histórico: comparação da expressão linguística de 1300 a 1900.
O corpus possibilita igualmente consultas de índole semântica. Por exemplo, a diferença de significado entre duas palavras relacionadas, pode ser determinada através da comparação e contraste das palavras vizinhas. Pode-se encontrar a frequência e a distribuição de sinónimos de mais de 20,000 palavras e comparar esta frequência em registos ou países diferentes, ou inclusive ao longo dos séculos.
[Informação colhida no site; alguns exercícios de pesquisa que fizemos mostraram o interesse que este serviço pode ter para quem usa e estuda a língua portuguesa]
Ótima ferramenta.
Estou chocado! Mandaram-me um e-mail a dizer que a not?cia mais importante do Expresso, na ?ltima semana, tem dois meses!!! Andamos a pagar 2,80 euros para sermos enganados como uns patinhos.
Est? aqui a prova: http://www.unodc.org/unodc/press_release_2006_10_05.html
Até na Reuters tinha saído!
http://www.alertnet.org/thenews/newsdesk/N05434086.htm