Platô - Número 3 - Volume 2 - Colóquio de Guaramiranga - V02

 

Embed or link this publication

Description

Platô - Número 3 - Volume 2 - Colóquio de Guaramiranga - V02

Popular Pages


p. 1



[close]

p. 2

Pede-se permuta On demande l’echange We ask for exchange Se pide intercambio Contato: Instituto internacional da Língua Portuguesa (IILP) Av Andrade Corvo, nº 8 Plateau, Cidade da Praia - Cabo Verde Telefone: (238) 261 95 04 www.iilp.org.cv www.riilp.org e-mail: revistariilp@gmail.com Colóquio Internacional de Guaramiranga: A Língua Portuguesa na Internet e no Mundo Digital Volume 2 Número 3 (organizador) 2013 Gilvan Müller de Oliveira Editores Gilvan Müller de Oliveira Rosângela Morello Secretaria Executiva Denise Fonseca Comitê editorial Ana Isabel Soares (Instituto Camões, Portugal) António Branco (Universidade de Lisboa, Potugal) Clémence Jouët-Pastré (Universidade de Havard, Estados Unidos da América) Emir José Suaiden (Instituto Brasileiro de Informação em Ciência e Tecnologia/IBICT, Brasil) Gregório Firmino (Universidade Eduardo Mondlane, Moçambique) Guadelupe Teresinha Bertussi (Universidade Pedagógica do México, México) Manuel Monteiro da Veiga (Universidade de Cabo Verde, Cabo Verde) Maria José Grosso (Universidade de Macau, Macau) Equipe Técnica Alberto Gonçalves: revisor técnico Ana Paula Seiffert: divulgação Felipe de Almeida: design gráfico Vanessa de Luca Bortolato: design gráfico Ficha catalográfica (em tramitação) Revista do Instituto Internacional da Língua Portuguesa (RIILP) - Instituto Internacional da Língua Portuguesa (IILP) - V.2, N.3 (2013), Cidade da Praia, Cabo Verde: Editora do IILP, 2012 Semestral ISSN: 2311-6625 on line Arte da capa: Felipe Almeida e Vanessa de Luca 1. Língua Portuguesa - Periódicos. 1. Instituto Internacional da Língua Portuguesa Todos os direitos autorais estão reservados a RIILP/IILP

[close]

p. 3

ÍNDICE 04 06 28 38 56 68 80 APRESENTAÇÃO: A LÍNGUA PORTUGUESA NA INTERNET E NO MUNDO DIGITAL Gilvan Müller de Oliveira O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS Daniel Pimienta A LÍNGUA PORTUGUESA FACE AO CHOQUE TECNOLÓGICO DIGITAL António Branco O USO DE CORPORA PARA A CONSTITUIÇÃO DE RECURSOS LEXICOGRÁFICOS DE REFERÊNCIA: O CASO DO VOC José Pedro Ferreira, Gladis Maria de Barcellos Almeida, Margarita Correia CONSIDERAÇÕES AO “COMPUTÊS”: COMO A ADOBE ADAPTA-SE ÀS NOVAS TENDÊNCIAS DO PORTUGUÊS NA INTERNET E NO MUNDO DIGITAL Guta Ribeiro A INTERNET EM MOÇAMBIQUE: IMPLANTAÇÃO, USO E DESAFIOS Inês Machungo / Gregório Firmino CONTRIBUTO GALEGO PARA A LÍNGUA PORTUGUESA NA ERA DIGITAL: AS FERRAMENTAS AO-OA DA ACADEMIA GALEGA DA LÍNGUA PORTUGUESA Ernesto Vazquez Sousa / Concha Rousia MULTILINGUISMO NO CIBERESPAÇO: A PARTICIPAÇÃO DO PORTUGUÊS NUMA B@BEL DIGITAL? Cláudio Menezes O CENTRO VIRTUAL CAMÕES: DIVULGAÇÃO E FORMAÇÃO Rui Vaz 96 106 PLATÔ V. 2. N.3 2013

[close]

p. 4

114 124 INTERNET: A NOVA GRANDE CARAVELA DA LÍNGUA PORTUGUESA NA ERA DIGITAL Afonso João Miguel CARTA DE GUARAMIRANGA PLATÔ V. 2. N.3 2013

[close]

p. 5

APRESENTAÇÃO A LÍNGUA PORTUGUESA NA INTERNET E NO MUNDO DIGITAL Gilvan Müller de Oliveira Que desafios e perspectivas marcam a gestão da língua portuguesa na nova economia ou na assim chamada economia do conhecimento? Qual a situação das línguas face à internet e quais ações e inovações têm sido implementadas? Constituindo um dos quatro eixos de discussão propostos ao Instituto Internacional da Língua Portuguesa pelo Plano de Ação de Brasília para a Promoção, Difusão e Projeção da Língua Portuguesa (PAB2010), estas e outras questões foram abordadas no III Colóquio “A Língua Portuguesa na Internet e no Mundo Digital” realizado em Guaramiranga, Ceará, Brasil, entre os dias 24 e 26 de abril de 2012. Especialistas e gestores de várias partes do mundo trouxeram ao debate as múltiplas faces da gestão das línguas nesse novo paradigma comunicacional das redes digitais. Este número reúne alguns dos tópicos debatidos no evento. Nos dois primeiros textos, ganha centralidade a análise da entrada das línguas na rede digital. Pimienta traz um breve histórico sobre a emergência da internet, discute a situação da língua portuguesa nesse ambiente e aponta a necessidade de ampliar não só o acesso dos falantes às tecnologias como, e principalmente, de gerar e disponibilizar conteúdos nas diferentes línguas. Na sequência, Branco descreve o choque tecnológico, dando destaque às ações necessárias para assegurar ao português sua posição de língua de comunicação internacional com projeção global. No segundo bloco temos a apresentação de dois importantes projetos para a gestão da lingua portuguesa. O primeiro deles é o Vocabulário Ortográfico Comum da Língua Portuguesa – VOC, concebido e realizado multilateralmente sob a coordenação geral do IILP. Os autores Ferreira, Almeida e Correia analisam os diferentes tipos de dados usados na construção de obras lexicográficas e descrevem a metodologia adotada no desenvolvimento do VOC, procurando mostrar o papel instrumental dos corpora para a definição de primeiras nomenclaturas de variedades em processo de estandardização, para a validação de dados obtidos da tradição e para a aferição da frequência e especificidade do âmbito de uso de cada entrada. Ribeiro, por sua vez, tematiza as iniciativas da Adobe Systems, analisando a constituição das comunidades de tradutores na internet, em especial no âmbito da lusofonia. A autora descreve os processos de criação, implementação e avaliação de alguns projetos da Adobe Systems destinados a potencializar o rápido acesso à informação e menciona os desafios e planos futuros. 04 PLATÔ V. 2. N.3 2013

[close]

p. 6

APRESENTAÇÃO: A LÍNGUA PORTUGUESA NA INTERNET E NO MUNDO DIGITAL Gilvan Müller de Oliveira É um panorama sobre a implantação e usos da internet em Moçambique que nos apresenta o texto Machungo e Firmino. De acordo com os autores, assiste-se no país a uma significativa implantação e uso de tecnologias de informação e comunicação e ao recurso à internet. No entanto, consideram que há constrangimentos que impedem um mais amplo acesso dos cidadãos à rede digital relacionados à situação socioeconômica e linguística do país caracterizada entre outros aspectos, pela diversidade linguística e um elevado índice de analfabetismo. Um terceiro conjunto de textos tematiza o desenvolvimento de iniciativas no âmbito de instituições de ensino ou promoção da língua portuguesa. Rousia e Vazquez Souza trazem uma síntese dos projetos digitais da Academia Galega da Língua Portuguesa colocando em destaque três deles: i) o Portulano de Recursos: escritório virtual e agrupador de recursos digitais sobre a língua portuguesa desenhado com o software livre Netvibes; ii) o Arquivo Digital: repositório de objetos digitais orientado à preservação e divulgação que funciona sobre um motor DSpace e gerencia metadados no standard Dublin Core; e iii) o projeto do Dicionário Eletrônico e-Estraviz em parceria com a AGAL (Associaçom Galega da Língua). Menezes faz uma breve descrição da situação estatística das línguas no mundo, discute metodologias e tecnologias para a inclusão e revitalização das línguas no mundo digital e conclui com uma apresentação de projetos e sugestões destinados a uma maior presença da língua portuguesa no ciberespaço. Rui Vaz coloca o foco sobre o Centro Virtual Camões e suas principais linhas de atuação o ensino e aprendizagem do português e formação dos agentes da educação, bem como para a divulgação da língua e cultura portuguesa. Por fim, Afonso Miguel lança um olhar abrangente sobre a história da língua portuguesa, mencionando sua potencialidade face à internet e os condicionamentos socioeconômicos, científicos e tecnológicos existentes em cada país. Entre os desafios enfrentados, o autor cita o reconhecimento das especificidades sociolinguísticas de cada país membro da CPLP, que requer, por exemplo, a inserção de terminologias científicas e técnicas locais no português comum a usar na internet e noutros meios digitais. Para fechar o número, A Carta de Guaramiranga sintetiza as principais demandas formuladas pelos participantes do III Colóquio, e nos impulsiona na busca por concretizar ações que garantam cada vez mais o pleno exercício do direito ao conhecimento sedimentado no democrático uso e consistente circulação das línguas na internet e no mundo digital, e muito especialmente do português. PLATÔ V. 2. N.3 2013 05

[close]

p. 7

O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS1 Daniel Pimienta Sobre o autor Presidente do FUNREDES2, Membro do comitê executivo da MAAYA3. Contato: pimienta@funredes.org Resumo Iniciando por uma breve introdução à questão das línguas na internet, apresentamos uma análise dos índices que mapeiam a sua presença trazendo dados específicos sobre o português. Desde uma perspectiva histórica, buscamos delinear tendências para o futuro das línguas mostrando a necessidade de ampliar não só o acesso dos falantes às tecnologias como, e principalmente, de gerar e disponibilizar conteúdos nas diferentes línguas. Palavras-chave Línguas na Internet. Português. Mapeamentos. Multilinguismo. Este artigo em português é inspirado em uma subseção de versão anterior publicada em inglês do capítulo Content and Language do livro Accelerating Development Using the Web: Empowering Poor and Marginalized Populations, G. Sadowsky Editor, W3C, 2012. A respectiva apresentação pode ser consultada na página: http://funredes.org/presentation/IILP-Fortaleza%20Portugues.ppt Traduzido para o português por Isis Ribeiro Berger. 2 Networks & Fundação para o Desenvolvimento (FUNREDES, sigla para o nome em espanhol – http://funredes.org) é uma organização não governamental com sedes na Republica Dominicana, França, Venezuela, Espanha e Guiana Francesa que tem sido pioneira (desde 1988) no campo do uso de Tecnologias da Informação e Comunicação para o Desenvolvimento (ICT4D) e tem trabalhado, desde sua fundação, na importância transversal da diversidade linguística por meio de diversos projetos que lidam com a exclusão digital, com o impacto social da Internet e também com o letramento digital. 3 MAAYA (Rede Mundial pela Diversidade Linguística), uma organização de sociedade civil, é uma rede de agentes interessados na diversidade linguística. Embora sua missão não enfoque somente no ciberespaço, uma grande parte das atividades da MAAYA é relacionada ao mundo digital. MAAYA é um sub-produto do processo WSIS e foi lançada em 2002 pela Academia Africana de Línguas (http://wwww.acalan.org). A MAAYA organizou três Simpósios Internacionais sobre Multilinguismo e Ciberespaço, um em 2009 em Barcelona (http://www.maaya.org/spip.php?article105) e outro em 2011 em Brasília (http://www.let.unb.br/simc/) e o terceiro em Paris, em 2012. A MAAYA, que está prestes a publicar um antologia sobre os riscos e desafios do multilinguismo no ciberespaço, tem assumido a iniciativa do projeto DILINET para resolver os problemas dos indicadores da diversidade linguística no ciberespaço. A MAAYA reúne alguns 25 agentes da área entre seus membros, incluindo organizações internacionais como a UNESCO, ITU e OIF (http://www.francophonie.org). MAAYA vem dedicando grande parte de sua energia na organização da Reunião Mundial de Cúpula sobre a Diversidade Linguística prevista para 2015. 1 06 PLATÔ V. 2. N.3 2013

[close]

p. 8

O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS Daniel Pimienta 1 - Introdução às línguas na internet O quão importante foi, é e será o fator linguístico na evolução da Internet? Quais repercussões poderia ter a internet na vida das línguas? Como os conteúdos da internet e as línguas se inter-relacionam? Qual a situação específica do português? Estas são questões difíceis de serem respondidas, em parte devido à escassez de dados mais sólidos. Os pioneiros da Internet (uma grande porcentagem de fato, se abarcarmos nessa ampla definição todos que contribuem e experts desde a década de 1980 até o início da década de 1990) criaram uma grande gama de neologismos e expressões originais que tentavam capturar as dimensões e originalidade da mudança de paradigma que estava ocorrendo concomitante ao desenvolvimento de redes de infraestrutura. Para citar apenas três exemplos: 1) A capacidade obtida para adequar o nível local ao nível global fez surgir o termo “glocal” com a conotação de algo que compartilha ambas as características. 2) Anonimidade no ciberespaço– alguns leitores devem se lembrar da famosa tirinha do nova-iorquino Peter Steiner em 1993 dizendo “Na internet, ninguém sabe que você é um cão”4. 3) Sempre foi lugar comum afirmar que “a internet não tem fronteiras”. Alguém deve se perguntar se esses recentes conceitos, que foram criados em contextos do inglês falado, são ainda pertinentes em um contexto multilíngue. No que se refere ao “glocal”, o termo definitivamente não é tão relevante: para a grande maioria de falantes de línguas indígenas que não possuem o inglês como segunda língua não é fácil relacionar seu ambiente local e a cultura holística ao espaço global do inglês falado com sua cultura mais regimentada e analítica. Já no que tange à anonimidade do cão que está usando a internet, aqueles dias não mais existem, especialmente se tratamos de um cão ‘socialmente conectado’. Nesse caso, muitas pessoas não estão cientes de que se trata de um cão, nem mesmo de que raça ou do que teve para o café da manhã, a não ser que, obviamente, não se trate de um cão falante de inglês. Já no que se refere à fronteira, esse é o caso mais interessante dos três. À luz da situação atual, o conceito de fronteira deve merecer ser desconstruído e reconstruído como uma nova expressão: ‘por internet, as únicas fronteiras são as línguas”5 e há centenas delas6, mais do que países existentes no mapa múndi. Somente pessoas multilíngues podem ousar cruzar algumas dessas fronteiras e as ferramentas vem sendo desenvolvidas para lidar com o desafio linguístico. O uso de tradutores automáticos está começando a oferecer uma certa ilusão equivocada para aqueles que buscam cruzar territórios estrangeiros. A “territorialidade linguística” da internet e como ela está relacionada aos conteúdos tem sido constantemente subestimada nas análises, porque as pessoas naturalmente tendem a pensar a partir de suas próprias fronteiras linguísticas. Assim, é importante descobrir e então analisar a dimensão oculta da capacidade da internet de incluir a fim de lidar com os desafios futuros do mais recente estágio de evolução e especialmente com a tão mencionada exclusão http://en.wikipedia.org/wiki/On_the_Internet,_nobody_knows_you%27re_a_dog Ver, por exemplo, http://googleresearch.blogspot.com/2011/07/languages-of-world-wide-web.html para ter ideia de quanto os territórios linguísticos tendem a ser rígidos. 6 Os índices para os números de línguas situadas (línguas que possuem uma existência digital) é considerado abaixo de 500 a contar de hoje. 4 5 PLATÔ V. 2. N.3 2013 07

[close]

p. 9

O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS Daniel Pimienta digital As línguas são importantes, talvez mais do que nunca, em fazer com que o mundo se torne menor. A internet aumenta a probabilidade de encontros entre pessoas de diferentes línguas e a pergunta real é: que uso relevante alguém pode fazer de seu acesso à internet se sua língua materna não é reconhecida ou se não há conteúdo em sua língua? Tais problemáticas não eram óbvias nos estágios iniciais do desenvolvimento da rede, quando a maioria dos usuários eram profissionais de Tecnologia da Informação, pesquisadores e acadêmicos ou, algumas vezes, ativistas internacionais de tecnologia. Tratava-se de pessoas altamente educadas, pelas quais o inglês era provavelmente compreendido no mínimo como segunda ou terceira língua por uma porcentagem significativa. No entanto, a rede se difundiu amplamente e as questões de ordem linguística se tornaram primordiais uma vez que seu objetivo é prover acesso a qualquer um no planeta. Dentre os sete milhões de seres humanos, menos de 20%7 são capazes de usar o inglês e provavelmente menos de 15% de forma eficiente. Somente essa estatística é um poderoso indicativo de que a crença de que o inglês será mantido como língua franca da rede tem seus dias contados. No século 21, a vantagem estratégica no mundo virtual aponta para o multilinguismo. Governos têm gradualmente se tornado conscientes dessa realidade e tentado encorajar uma mudança que abarque outras línguas. O Conselho Britânico, por exemplo, alertou jovens cidadãos ingleses sobre o risco que estão correndo na nova economia da União Europeia se permanecerem monolíngues [Graddol-2006]. Dessa forma, a questão da escolha linguística e diversidade na internet é uma das chaves para abrir portas para a inclusão digital de forma mais direta e abrangente, especialmente levando em consideração a ligação complexa e indissolúvel entre as línguas, o substrato de conhecimento e o conteúdo, uma das duas facetas chaves para que a malha da rede8 seja melhor compreendida. 2 - Alguns índices sobre as línguas na internet Que dados podem ser coletados neste estágio considerando a variedade e a presença proporcional das línguas na internet? Antes de responder essa pergunta, será útil retomar alguns fatos sobre as línguas e situar o estágio em que nos encontramos atualmente. Há uma estimativa de 30.000 línguas existentes no mundo desde que os serem humanos tornaram-se capazes de produzir discurso. A partir de então, muitas línguas tornaram-se extintas e, em tempos modernos, há uma estimativa de que algo em torno de 6000 a 9000 permanecem em uso. Levando em consideração os requisitos para que todas as línguas tenham uma existência na rede9, 7 Comumente, em demolinguística, não há índices consensuais para a população total do mundo com capacidade de compreender inglês como segunda língua. A população usuária de inglês como primeira língua é estimada em menos de 375 milhões (menos de 6% da população mundial). O índice para o inglês como segunda língua possui grandes variações, dependendo em particular da definição do nível de letramento: de 470 milhões para um bilhão (que perfaz um total de falantes de inglês no mundo na casa dos 10%-20%). Graddol (2006) apresenta um índice de 508 milhões de falantes de inglês como segunda língua (citando uma referência de Nicholas Ostler, 2005, publicada em ‘Empires of the Word: a language history of the world.‘ London, Harper Collins) - mas ele previa que esse número poderia ser maior que 1 bilhão. No livro “O futuro do inglês” (‘The future of English’, British Council, 2000) Graddol apresenta estimativa (em milhões) para as três seguintes categorias: inglês como primeira língua (375), inglês como segunda língua (375) e inglês como língua estrangeira (750). A questão permanece no nível em que se qualificam as pessoas da última categoría: nível de falantes eficientes. 8 A outra sendo a comunicação que é também mantida por meio das línguas. 9 Ter uma existência digital começa pela localização da língua. Esse conceito se refere a codificação de seu alfabeto e isso acarreta em uma série de outros requisitos desde a existência de softwares relacionados a essa língua (a exemplo dos corretores gramaticais e dicionários) à existencia de conteúdos significativos. Vide Diki Kidiri [2008]. 08 PLATÔ V. 2. N.3 2013

[close]

p. 10

O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS Daniel Pimienta consideremos os fatos a seguir em torno das línguas (Lewis, 2009; Crystal, 2006): - 6 línguas (inglês, árabe, espanhol, português e russo) são as línguas oficiais em 60% dos países. - 1.3% das línguas (85) são faladas por mais de 10 milhões de pessoas cada e juntas representam 78% da população mundial. - 50% de todas as línguas são faladas por menos de 10.000 pessoas. - 25% - Uma língua desaparece em média a cada dois meses. - Menos de 10% das línguas possuem sua forma escrita 10 . A questão da presença das línguas na internet pode ser verificada pelo cruzamento de dados do Ethnologue sobre as línguas11 com os dados do ITU referentes aos acessos à internet12 . Parece que há uma correlação estatística entre países com grande diversidade linguística e países com baixa penetração na internet13. Então, o que sabemos exatamente sobre a presença das línguas na internet? A situação atual é de certa forma paradoxal e frustrante! Por muitos anos a temática alcançou somente um interesse marginal e poucos pioneiros produziram indicativos experimentais (Pimienta–2009-2). Agora o tema da diversidade linguística vem ganhando mais atenção e, enquanto alguns dos esforços passados perderam vigor, há grande estímulo para avaliar profundas mudanças que ocorreram no universo do conteúdo. Ao buscar dados sobre o número de usuários da internet por línguas, o Globalstats14 apresentou índices alguns anos atrás e era claro quanto à metodologia usada para coletá-los. Desde 2007, o Internet world stats15 o substituiu assumindo a liderança, no entanto os dados agora são limitados às “dez mais” línguas. Seguem os dados relativos ao ano de 2011: http://www15.gencat.cat/pres_casa_llengues/AppJava/frontend/sabiesque_detall.jsp?id=18&idioma=5 http://www.ethnologue.com/web.asp 12 http://www.itu.int/ITU-D/ict/statistics/ 13 Outras duas correlações que têm levantado questionamento são entre a grande biodiversidade e a alta diversidade linguistica e outra entre quaisquer uma das duas e a questão da pobreza. Em outras palavras, a parte rica do planeta é rica em informação mas é linguisticamente pobre. 14 A fonte URL (http://global-reach.biz/globstats/index.php3) desapareceu mas o motor “Wayback” do archive.org permite que acessemos as últimas memórias para armazenar as mais recentes informações memorizadas de 2008 e que mostra os dados produzidos em 2004: http://web.archive.org/web/20041019013615/www.global-reach.biz/globstats/index.php3 11 http://www.internetworldstats.com/ 10 11 1PLATÔ V. 2. N.3 2013 09

[close]

p. 11

O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS Daniel Pimienta Tabela 1: Número de usuários da internet por língua, 31 de maio de 2011 As 10 línguas mais usadas na rede ( Número de usuários da internet por língua ) As dez maiores línguas na internet Usuários da internet por língua Penetração na internet por língua Crescimento na internet (2000 - 2011) Usuários da Internet % do total População mundial para tal língua Estimativa de 2011) inglês chinês espanhol japonês português alemão árabe francês russo coreano As 10 maiores línguas Outras línguas Total mundial 565,004,126 509,965,013 164,968,742 99,182,000 82,586,600 75,422,674 65,365,400 59,779,525 59,700,000 39,440,000 1,615,957,33 3 350,557,483 2,099,926,96 5 43.4 % 37.2 % 39.0 % 78.4 % 32.5 % 79.5 % 18.8 % 17.2 % 42.8 % 55.2 % 36.4 % 14.6 % 30.3 % 301.4 % 1,478.7 % 807.4 % 110.7 % 990.1 % 174.1 % 2,501.2 % 398.2 % 1,825.8 % 107.1 % 421.2 % 588.5 % 481.7 % 26.8 % 24.2 % 7.8 % 4.7 % 3.9 % 3.6 % 3.3 % 3.0 % 3.0 % 2.0 % 82.2 % 17.8 % 100.0 % 1,302,275,670 1,372,226,042 423,085,806 126,475,664 253,947,594 94,842,656 347,002,991 347,932,305 139,390,205 71,393,343 4,442,056,069 2,403,553,891 6,930,055,154 Fonte : http://www.internetworldstats.com/stats7.htm No que tange à estrutura do universo de conteúdos, em termos de línguas, a regra foi a existência de índices conflitantes entre os anos de 1997 e 2007 (Pimienta-2009-2). Algumas fontes de dados indicaram uma estável (e exagerada) presença do inglês (cerca de 80% ao longo da década). Outras fontes de dados, com mais amostras, apontaram para um declínio constante de 80% para 45% no mesmo período. Nos últimos anos, a situação tem sido extremamente complexa principalmente devido às mudanças estruturais e quantitativas da rede. Enquanto motores de busca foram capazes de indexar16 uma parte significante da rede no período de 1996 a 2007 (cerca de 80%), desde 2007 vem apresentando declínio de, provavelmente, no mínimo 10% e está se tornando pior a cada dia. Enquanto muitas fontes tentaram quantificar o tamanho da rede até aproximadamente o ano de 2008 (vide PIMIENTA, 2008), desde então ninguém parece ousar prover mais informações, ainda que seja uma aproximação para dados qualitativos, embora dados quantitativos existam sob a forma de usuários da internet, nomes de domínios registrados, hosts e endereços de IP. Uma página indexada é uma página cujo conteúdo foi analisado e a informação foi armazenada para posterior acesso pelos motores de busca. 16 10 PLATÔ V. 2. N.3 2013

[close]

p. 12

O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS Daniel Pimienta Tabela 2: O tamanho da Internet INTERNET ELEMENT FIGURE Usuários da Internet - (Fonte: Internet world stats) Domínios ativos registrados (Fonte: http://news.netcraft.com/archives/web_server_survey.html ) Domínios registrados (Fonte: : http://news.netcraft.com/archives/web_server_survey.html ) Internet hosts (Fonte : http://www.domaintools.com/internetstatistics/country-ip-counts.html) Páginas da rede17 Páginas indexadas da rede 2008 1.4 bilhões 70 milhões 2011 2.1 bilhões 160 milhões 140 milhões 463 milhões 500 milhões 3500 milhões 140 bilhões18 ????? 20–40 bilhões Provavelmente o mesmo que em 200819 Além da confirmação do crescimento exponencial da internet, o que pode se depreendido dessa tabela é que o tamanho dos indexos vinha alcançando uma assíntota até 2007 e a proporção de páginas indexadas passa por um declínio constante desde então (de 80% a provavelmente, menos de 10%). Por que esses dados relativos às ferramentas de busca são tão relevantes para a temática da diversidade linguística na Internet? Eles têm impacto direto no estudo da diversidade linguística porque alguns dos métodos para avaliar a presença das línguas na rede consistem nos motores de busca, que eram capazes de contar ocorrências de vocábulos. Eles também têm um impacto indireto porque os outros métodos de busca consistem em “rastrear a rede”20 e aplicar um algoritmo de reconhecimento de línguas para cada página. Se as poderosas companhias desenvolvendo motores de busca desistem de navegar por todo o universo da internet, de que forma uma seção de busca de alguma outra organização irá investir em alguma tarefa lucrativa? Finalmente, indexar é também relevante para a temática devido a uma dialética negativa. A ausência de uma página nos índices dos motores de busca é praticamente a garantia da sua invisibilidade. Além disso, com a decrescente porcentagem de indexação, que não é aplicada de forma igualitária entre as línguas, existe uma tendenciosidade nos dados que possui implicações críticas para as línguas que não são consideradas globalmente relevantes21. Em síntese: a rede se tornou praticamente infinita Se algo é considerado “rede invisível” (páginas dinâmicas principalmente) espera-se que seja de 100 a 500 vezes maior de acordo com Bergman, M. The Deep Web: Surfacing Hidden Value http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno=3336451.0007.104, e então o índice poderá alcançar um trilhão 18 Em 2008 um novo motor de busca foi lançado com o nome de CUIL (http://en.wikipedia.org/wiki/Cuil) o qual supõe ter um indexo de tamanho próximo ao do tamanho da rede, oferecendo o índice de 120 bilhões de páginas. 19 http://www.worldwidewebsize.com/ apresenta índices entre 20-50 bilhões de páginas indexadas em 2011. O Google, por sua vez, não tem fornecido índices públicos (http://www.google.com/help/indexsize.html). http://dejanseo.com.au/measuring-size-of-googles-index/ apresenta dados de 25 bilhões. 20 “Crawling the web” (Rastreamento da rede) se refere ao mecanismo usado, por exemplo, pelos motores de busca para criar suas bases de dados indexados para sistematicamente ler cada página de cada sítio visando analisar seus conteúdos. O tamanho da rede é tão grande que alguns truques são usados para evitar a leitura de cada uma das páginas (por exemplo, limitando a profundidade da inserção na árvore de relações [links] de um mesmo sítio). 21 Perceba que seria benéfico ser capaz de medir a inclinação linguística dos motores de busca e também se essa situação pudesse abrir caminhos para a criação de motores de busca dedicados às línguas ou famílias de línguas. 17 PLATÔ V. 2. N.3 2013 11

[close]

p. 13

O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS Daniel Pimienta e novos métodos são necessários para que se possa compreender a sua natureza, a estrutura de seu conteúdo e particularmente em termos de línguas. No entanto, não se trata somente de tamanho: a natureza da rede por si só mudou consideravelmente à medida que o conceito de páginas da internet evoluiu de estático (como era no início) para dinâmico22 (o que se tornou a regra). Abordagens totalmente novas são necessárias para vasculhar em sua complexa estrutura e para desenvolver indicadores significativos e acurados da diversidade linguística. A pesquisa dessas ferramentas e metodologias não somente forneceria um caminho para caracterizar a vasta substância da rede e melhor compreender o universo do conteúdo da Internet; também abriria novos caminhos para novos modelos de motores de busca (Search 2.0) capazes de melhor lidar com a info-diversidade do universo de conteúdos. Isso tudo é tanto mais importante porque o universo peculiar de conteúdos está agora ameaçado por muitos fatores, incluindo o spam, cópias e ausência de uma cobertura adequada de línguas. Nesse contexto, caracterizado pela falta de produção de indicadores estáveis, confiáveis e sustentáveis para a diversidade linguística, e até que projetos como o DILINE23 produza indicadores necessários, a única opção é confiar nos índices fornecidos pelas três mais importantes fontes: Internet World Stats, para índices de usuários por língua; o Projeto Observatório das Línguas (Language Observatory Project)24 e FUNREDES/Union Latina25, para dado relativos à páginas da rede por língua. No que se refere ao primeiro período, de 1997-2007, os estudos de referência (Pimienta, 2009-2) mostraram alguns fatos que serão descritos adiante. Em termos de prevalência de línguas, o inglês não foi tão crucial quanto indicado; a porcentagem de páginas em inglês decresceu de forma regular, de 80% em 1998 para 40% no ano de 2007. Essa tendência acompanhou, com certo grau de paralelismo, a porcentagem de usuários da internet falantes de inglês (fonte: InternetWorldStats); estimado para estar acima de 60% em 1998 e decrescendo para 32% em 2008, sendo o índice atual de 26,8% (dezembro de 2011)26. Os dados mostraram uma primeira etapa (1998-2003) quando a razão entre conteúdos e usuários teve pequena variação em torno das línguas. Esse quadro ofereceu as bases para argumentos em favor do fomento de políticas públicas para o provimento de acesso a usuários como uma forma natural para a geração de conteúdos de forma linguisticamente proporcional. Em uma segunda etapa (2004-2008), essa razão entre os conteúdos e usuários sofreu decréscimo mostrando que a última leva de usuários da internet era mais frequentemente de consumidores de conteúdos do que de produtores dos mesmos. Isso pode ser explicado pelo fato de que os primeiros usuários da internet possuíam alto grau de letramento digital. Naquele 22 Uma página estática tem a propriedade de aparecer sempre idêntica quando acessada por um browser (um programa como o Internet Explorer ou Mozilla) através da indicação da URL (Unified Resource Locator – Localizador de Fontes Unificado) no campo para os endereços das páginas, (uma expressão como http://www.w3.org/Addressing/URL/url-spec.txt). Uma página dinámica tem seu conteúdo em evolução ao longo do tempo e dependendo do contexto (a exemplo dos acessos a base de dados). 23 Sob a liderança da MAAYA, respeitados Centros de Pesquisa estão unindo esforços com a Unesco, ITU, OIF, União Latina e Funredes para abrir o campo para projetos de pesquisa avançada que buscariam sistematizar a criação de indicadores da diversidade linguística no mundo digital. O consórcio está atualmente em fase de definição para conseguir fundos da European Union Reserch funds (7th Programa Modelo) em posição preferencial devido ao tamanho do investimento solicitado e as inovações em pesquisa implicadas. Muitos dos parceiros, especialmente organizações internacionais e civis, irão manter a pressão até que os orçamentos sejam feitos, já que políticas públicas, assim como a economia digital, irá se beneficiar com o desenvolvimento e manutenção de tais indicadores com vistas ao progresso. Vide http://dilinet.org. 24 O Projeto Observatório de Línguas : http://www.language-observatory.org/ 25 Observatório de Línguas e Culturas na Internet da Funredes: http://funredes.org/lc ou União Latina http://dtil.unilat.org/LI/2007/index_fr.htm 25 With Chinese very close at 24.2%. 12 PLATÔ V. 2. N.3 2013

[close]

p. 14

O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS Daniel Pimienta momento, os mais recentes eram conduzidos virtualmente para a chamada netiquette27 e para o comportamento digital. Na era atual, há um argumento válido em prol de políticas de desenvolvimento do letramento digital de novos usuários da Internet e estímulo para que esses usuários sejam produtores assim como consumidores do que está disponível na rede. Uma mensagem muito importante tem sido estabelecida pelos primeiros estudos (da Funredes/União Latina assim como os da LOP) sobre a exclusão digital no hemisfério sul. Ela evidenciou que a lacuna de conteúdo foi bem maior que a lacuna de acesso para línguas internacionais e várias ordens de magnitude para línguas locais, conforme demostrado nos seguintes índices: - 4% dos acessos globais são derivados da África (Fonte: Internet world stats 2007 ) - 0.6 % dos sites em francês possuem base na África (Fonte: Funredes/União Latina 2007) - 0.6% dos sites em inglês possuem base na África (Fonte: Funredes/União Latina 2007) - A porcentagem de páginas em línguas locais africanas varia de 0.06% a 0.0006% dependendo da língua (Fonte: LOP 2007) A exclusão digital deve então ser muito mais uma questão de conteúdos e de línguas do que de acessos propriamente ditos. Esse ponto é um argumento extremamente importante em favor de políticas de inclusão digital que não se restringem à questão do acesso, mas que também enfoquem em conteúdos locais (e indiretamente na educação para fomentar novos produtores de conteúdos, um processo que se inicia pelo estímulo ao letramento digital)29. No que concerne ao segundo período mencionado anteriormente, há diversas descobertas que apontam para diversas tendências possíveis, apesar da ausência de indicadores de produção estáveis: - A evolução recente da Rede mostra um número considerável de usuários chineses da internet se sobrepondo ao número total de usuários americanos em julho de 200830. - Após o movimento revolucionário no norte da África e Oriente Médio, o espaço da língua árabe no Facebook está crescendo rapidamente e, se a tendência persistir, irá logo sobrepor-se ao inglês31 nessas regiões. - A Wikipedia é o espaço da internet com maior diversidade linguística abrangendo aproximadamente 271 línguas diferentes que nela contribuem com artigos32. - O índice máximo de 271 para a Wikipedia é comparado aos índices das 70 línguas que o Mozilla suporta, das 67 do Facebook, das 63 do Internet Explorer, 51 do Google Tradutor, 50 do Blogger, 19 do YouTube, 6 do Flickr e 4 do LinkedIn33. Netiquette é um neologismo que se refere à comportamentos aceitáveis na rede. Mais detalhes podem ser encontrados em http://www.albion.com/netiquette/. 28 Esse dado felizmente aumentou para 11.4% em 2011 mas há grande probabilidade de que a exclusão de conteúdos não mude muito. 29 O que está em questão é o conceito de “pertença” da tecnologia que não deve ser confundida com a questão do acesso. Vide (Pimienta, -2009-1) para desenvolvimento mais detalhado do conceito. 30 http://www.nytimes.com/2008/07/26/business/worldbusiness/26internet.html 31 http://www.slateafrique.com/17731/sur-facebook-arabe-depasse-anglais 32 Além disso, a Wikipedia manteve uma maravilhosa compilação de dados estatísticos sobre as línguas: http://en.wikipedia.org/wiki/Wikipedia:Multilingual_statistics. Aparentemente, outro indicativo de tempos de mudança, esta página não vem sendo atualizada desde outubro de 2008 em algumas partes e desde dezembro de 2009 para dados diretos em cada uma das línguas. No entanto, a Wikipedia está oferecendo agora uma página nova e muito interessante para dados estatísticos, (http://stats.wikimedia.org/) que inclui alguns dados sobre as línguas (http://stats.wikimedia.org/#fragment-12). 33 Todas essas fontes correspondem ao ano de 2010 e se referem à interface (não ao conteúdo). 27 PLATÔ V. 2. N.3 2013 13

[close]

p. 15

O ESPAÇO DAS LÍNGUAS NA INTERNET: PANORAMA E TENDÊNCIAS COM ÊNFASE NO PORTUGUÊS Daniel Pimienta - Um estudo produzido pela União Latina em 201034 desenvolveu uma perspectiva da evolução da proporção das línguas em várias áreas da Internet, a partir da coleta de grande número de fontes virtuais demográficas e estatísticas35. No entanto, havia uma lacuna no que se refere a uma unidade metodológica que desse conta das fontes e dados em níveis variados de confiabilidade. Por isso, os resultados só podem ser visualizados como indicativos das possíveis tendências. Este estudo não foi publicado ainda e alguns dos excertos apresentados adiante possuem a permissão de Daniel Prado. 35 Segue seleção de algumas fontes relevantes usadas para tal estudo: http://socialmediastatistics.wikidot.com/ http://www.w3schools.com/browsers/browsers_firefox.asp http://www.readwriteweb.com/archives/international_blogosphere.php http://technorati.com/state-of-the-blogosphere/ http://www.mathaba.net/news/?x=408348 http://blogalize.typepad.com/micro/statistics/ http://www.sysomos.com/insidetwitter/ http://en.wordpress.com/stats/ http://www.p2pon.com/2010/02/19/10-million-downloads-of-pirated-games-in-december-alone-says-esa/ http://journal.webscience.org/209/2/websci09_submission_115.pdf http://www.email-marketing-reports.com/metrics/email-statistics.htm http://www.sifry.com/alerts/archives/000433.html and http://www.sifry.com/alerts/archives/000436.html http://mashable.com/2010/02/24/half-messages-twitter-english/ http://www.vincegolangco.com/2010/very-interesting-social-media-statistics-facebooktwitter-flickr-linkedin-etc/ 34 14 PLATÔ V. 2. N.3 2013

[close]

Comments

no comments yet