Início das actividades da Wikimedia Portugal

23:48, Sunday, 24 2010 January UTC

Ouvir com webReader

Este post já deveria ter chegado há muito mais tempo. Mas o tempo não o permitiu…

Não deve ser novidade que a Wikimedia Portugal (WMP) já arrancou o Plano de Actividades para 2010-11. A primeira actividade oficial foi uma apresentação num seminário no Instituto Superior Técnico promovido pela Presidência do Departamento de Engenharia Informática, a convite do prof. José Borbinha, que gostámos muito de conhecer e a quem agradecemos o apoio e disponibilidade que demonstrou para connosco.

A Susana fez uma exposição da Wikimedia Foundation, do nosso contexto WMP, do processo editorial, da estrutura interna dos projectos (utilizadores, categorias, etc), da manutenção, licenciamento, etc.

A apresentação está aqui:
http://wikimedia.pt/download/Wikimedia_Slideshow.pps

Eu juntei-me à festa, atendendo a um público de informática, e apresentei brevemente a plataforma da WMF (servidores, software, arquitectura) mas o grosso da minha mini-apresentação foi para falar de predefinições, dados estruturados e seus benefícios na Wikipédia e, por fim, divaguei um bocadinho até à Web Semântica, conceito para o qual a Wikipédia está a ser bastante utilizada (os tópicos estão resumidos em 2 posts que já tinha feito no blog [1][2]).

A apresentação está aqui:
http://wikimedia.pt/download/Wikimedia_Web_Semantica.pps

Wikipédia consegue arrecadar U$7,5 milhões em 2009

21:30, Monday, 04 2010 January UTC

O Wikipédia anunciou nesta semana que atingiu seu objetivo de arrecadar 7,5 milhões de dólares em 2009.

“Obrigado a todos que fizeram doações!” celebrou em um comunicado o co-fundador do site, Jimmy Wales.

O dinheiro será usado para cobrir os custos operacionais da empresa, que inclui manutenção de servidores e pagamentos de salários.

É interessante que desde sua fundação o site nunca teve propagandas, em uma tentativa de impedir que a “enciclopédia livre” fosse tendenciosa.

in jornaltecnologia

Um projecto vivo que dá vida

01:20, Friday, 11 2009 December UTC

Desesperado ao perceber que sua esposa acabava de entrar em trabalho de parto em casa, o britânico Leroy Smith resolveu contar com a ajuda da internet, mais especificamente do Google. O futuro papai digitou então no mecanismo de busca “how to deliver a baby” (ou “como fazer um parto”, em português) para saber por onde começar

(…)

Depois de seguir o guia detalhado que encontrou na Wikipédia, Emma deu à luz em segurança uma menina, de 2,8 Kg, que ganhou o nome de Mahalia Merita Angela Smith.

fonte

Actualização das páginas órfãs

03:45, Sunday, 18 2009 October UTC

Ouvir com webReader

A pedido do Lijealso, aqui vai uma actualização das estatísticas incompletas da Wikipédia lusófona para o caso das páginas órfãs.

Constatou-se que o dump utilizado anteriormente era insuficiente, pelo que se descarregou a tabela pagelinks, desta vez do dump de 20091015. Para se excluir os redireccionamentos, importou-se também a tabela redirect.

Fartei-me entretanto de alternar entre o que estava a fazer e a lista de códigos de domínios, pelo que criei uma pequena tabela auxiliar:

MySQL:
  1. mysql> CREATE TABLE _namespaces ( id TINYINT NOT NULL, namespace VARCHAR(50), PRIMARY KEY (id) );
  2. Query OK, 0 rows affected (0.01 sec)
  3.  
  4. mysql> INSERT INTO _namespaces VALUES (-2,'Media'),(-1,'Especial'),(0,''),(1,'Discussão'),(2,'Usuário'),(3,'Usuário Discussão'),(4,'Wikipedia'),(5,'Wikipedia Discussão'),(6,'Ficheiro'),(7,'Ficheiro Discussão'),(8,'MediaWiki'),(9,'MediaWiki Discussão'),(10,'Predefinição'),(11,'Predefinição Discussão'),(12,'Ajuda'),(13,'Ajuda Discussão'),(14,'Categoria'),(15,'Categoria Discussão'),(100,'Portal'),(101,'Portal Discussão'),(102,'Anexo'),(103,'Anexo Discussão');
  5. Query OK, 22 rows affected (0.00 sec)
  6. Records: 22  Duplicates: 0  WARNINGS: 0

O resultado deu-me um incrível total de 769854 páginas órfãs, pelo que decidi separá-las por namespace para permitir prioritizar a análise:

MySQL:
  1. mysql> SELECT p.page_namespace,count(1) FROM page p
  2.     -> LEFT JOIN redirect  r
  3.     -> ON p.page_id = r.rd_from
  4.     ->
  5.     -> LEFT JOIN pagelinks pl
  6.     -> on pl.pl_namespace = p.page_namespace
  7.     -> and pl.pl_title = p.page_title
  8.     ->
  9.     -> WHERE r.rd_from IS NULL
  10.     -> AND pl.pl_from IS NULL
  11.     ->
  12.     -> GROUP BY p.page_namespace;
  13. +----------------+----------+
  14. | page_namespace | count(1) |
  15. +----------------+----------+
  16. |              0 |    12958 |
  17. |              1 |   103645 |
  18. |              2 |    16592 |
  19. |              3 |   568675 |
  20. |              4 |     1954 |
  21. |              5 |      856 |
  22. |              8 |      773 |
  23. |              9 |       17 |
  24. |             10 |     7522 |
  25. |             11 |     1014 |
  26. |             12 |        3 |
  27. |             13 |       27 |
  28. |             14 |    51735 |
  29. |             15 |     1315 |
  30. |            100 |     1190 |
  31. |            101 |      117 |
  32. |            102 |      173 |
  33. |            103 |     1288 |
  34. +----------------+----------+
  35. 18 rows in SET (20.90 sec)

O resultado do cruzamento das duas tabelas foi afixado aqui, com uma listagem de 15M para os 12958 artigos no domínio principal. Na verdade, esta listagem foi feita para colar numa página wiki, no entanto tenham em atenção que são 15M, pelo que não recomendo fazê-lo. Têm outras listas (como a mais simples, em formato pageid,namespace,title) nessa directoria.

Revisita aos dumps da Wikipédia

00:44, Tuesday, 06 2009 October UTC

Ouvir com webReader

Desta vez em português, decidi dar [alguma] continuidade ao que comecei há uns dias com a importação dos dumps da Wikipédia. Graças à dica do Rei-artur foi fácil extrair a lista de robôs, para excluir das estatísticas.

CODE:
  1. [myself@speedy ~]# wget 'http://pt.wikipedia.org/w/api.php?action=query&list=allusers&aufrom=A&augroup=bot&aulimit=500&format=txt' -q -O - > bots.tmp
  2.  
  3. [myself@speedy ~]# cat bots.tmp | grep '\[name\]' | sed 's,^.*\[name\] => ,,' > /tmp/bots.txt

Aproveitei e repesquei os user_id para simplificar as pesquisas sem fazer alterações na tabela user.

MySQL:
  1. mysql> CREATE TABLE user_bots ( bot_name VARCHAR(25) );
  2. Query OK, 0 rows affected (0.01 sec)
  3.  
  4. mysql> LOAD DATA INFILE '/tmp/bots.txt' INTO table user_bots;
  5. Query OK, 136 rows affected (0.00 sec)
  6. Records: 136  Deleted: 0  Skipped: 0  WARNINGS: 0
  7.  
  8.  
  9. mysql> ALTER TABLE user_bots add COLUMN bot_user_id INT;
  10. Query OK, 136 rows affected (0.01 sec)
  11. Records: 136  Duplicates: 0  WARNINGS: 0
  12.  
  13. mysql> ALTER TABLE user add index idx_t ( user_name );
  14. Query OK, 119134 rows affected (2.63 sec)
  15. Records: 119134  Duplicates: 0  WARNINGS: 0
  16.  
  17. mysql> UPDATE user_bots ub JOIN user u on user_name = bot_name SET ub.bot_user_id = u.user_id;
  18. Query OK, 134 rows affected (0.00 sec)
  19. Rows matched: 134  Changed: 134  WARNINGS: 0
  20.  
  21. mysql> ALTER TABLE user_bots add PRIMARY KEY (bot_user_id);
  22. Query OK, 136 rows affected, 1 warning (0.00 sec)
  23. Records: 136  Duplicates: 0  WARNINGS: 1
  24.  
  25. mysql> SHOW WARNINGS;
  26. +---------+------+---------------------------------------------------+
  27. | Level   | Code | Message                                           |
  28. +---------+------+---------------------------------------------------+
  29. | Warning | 1265 | Data truncated for COLUMN 'bot_user_id' at row 71 |
  30. +---------+------+---------------------------------------------------+
  31. 1 row in SET (0.00 sec)
  32.  
  33. mysql> UPDATE user_bots SET bot_user_id = -1 WHERE bot_user_id = 0;
  34. Query OK, 1 row affected (0.00 sec)
  35. Rows matched: 1  Changed: 1  WARNINGS: 0

Não tinha reparado que havia um utilizador/robô com o nome "MediaWiki default" mas, bem, depois de criar a Primary Key ficou com o bot_user_id=0 e, para evitar que coincidisse com o agregado para anonymous, dei-lhe o bot_user_id=-1.

Então agora já estamos prontos a completar a query onde ficámos no último dia (número de edições em artigos distintos em cada namespace por utilizador):

MySQL:
  1. mysql> EXPLAIN SELECT epn.user_name,epn.page_namespace,epn.edits
  2.     -> FROM edits_per_namespace epn
  3.     -> LEFT JOIN user_bots ub ON epn.user_id = ub.bot_user_id
  4.     -> WHERE ub.bot_user_id IS NULL
  5.     -> AND epn.user_id <> 0
  6.     -> ORDER BY edits desc limit 20;
  7. +----+-------------+-------+--------+---------------+---------+---------+----------------------+--------+--------------------------------------+
  8. | id | select_type | table | type   | possible_keys | key     | key_len | ref                  | rows   | Extra                                |
  9. +----+-------------+-------+--------+---------------+---------+---------+----------------------+--------+--------------------------------------+
  10. 1 | SIMPLE      | epn   | ALL    | NULL          | NULL    | NULL    | NULL                 | 187624 | USING WHERE; USING filesort          |
  11. 1 | SIMPLE      | ub    | eq_ref | PRIMARY       | PRIMARY | 4       | ntavares.epn.user_id |      1 | USING WHERE; USING index; NOT EXISTS |
  12. +----+-------------+-------+--------+---------------+---------+---------+----------------------+--------+--------------------------------------+
  13. 2 rows in SET (0.00 sec)
  14.  
  15. mysql> SELECT epn.user_name,epn.page_namespace,epn.edits
  16.     -> FROM edits_per_namespace epn
  17.     -> LEFT JOIN user_bots ub ON epn.user_id = ub.bot_user_id
  18.     -> WHERE ub.bot_user_id IS NULL
  19.     -> AND epn.user_id <> 0
  20.     -> ORDER BY edits desc limit 10;
  21. +----------------+----------------+-------+
  22. | user_name      | page_namespace | edits |
  23. +----------------+----------------+-------+
  24. | EMP,Nice poa   |              0 | 58138 |
  25. | Dantadd        |              0 | 44767 |
  26. | João Carvalho  |              3 | 44533 |
  27. | OS2Warp        |              0 | 43396 |
  28. | Yanguas,Sonlui |              0 | 37020 |
  29. | Lijealso       |              0 | 34157 |
  30. | Rei-artur      |              0 | 33863 |
  31. | Tumnus         |              3 | 33213 |
  32. | Nuno Tavares   |              0 | 31910 |
  33. | Bisbis         |              0 | 29886 |
  34. +----------------+----------------+-------+
  35. 10 rows in SET (0.76 sec)

Os resultados completos estão aqui.

Já agora, para finalizar, a tão afamada lista de wikipedistas por número de edições:

MySQL:
  1. mysql> CREATE TABLE edits_per_user SELECT rev_user,count(1) as counter FROM revision GROUP BY rev_user;
  2. Query OK, 119134 rows affected (12.61 sec)
  3. Records: 119134  Duplicates: 0  WARNINGS: 0
  4.  
  5. mysql> SELECT u.user_name,epu.counter
  6.     -> FROM edits_per_user epu
  7.     -> LEFT JOIN user_bots ub on ub.bot_user_id = epu.rev_user
  8.     -> JOIN user u on epu.rev_user = u.user_id
  9.     -> WHERE ub.bot_user_id IS NULL ORDER BY counter desc limit 10;
  10. +----------------+---------+
  11. | user_name      | counter |
  12. +----------------+---------+
  13. | anonymous      | 3119758 |
  14. | EMP,Nice poa   |  176338 |
  15. | OS2Warp        |  163751 |
  16. | Dantadd        |  105657 |
  17. | Lijealso       |   90025 |
  18. | Yanguas,Sonlui |   89152 |
  19. | Rei-artur      |   83662 |
  20. | Mschlindwein   |   75680 |
  21. | Bisbis         |   75361 |
  22. | Nuno Tavares   |   73141 |
  23. +----------------+---------+
  24. 10 rows in SET (0.05 sec)

Os resultados completos estão aqui.

Revisita aos dados estruturados

14:36, Saturday, 03 2009 October UTC

Ouvir com webReader

Há alguns dias num mergulho profundo sobre a utilização de wikis em campos específicos deparei-me com uma "foto" da Wikipédia muito interessante, aqui, que ilustra, entre outras coisas, a actividade na Wikipédia, a vários níveis: Visualizing Science & Tech Activity in Wikipedia:


Fonte: A Beatiful WWW

O website, A Beatiful WWW, dedica-se à extracção e representação dos volumes de informação distintos que conhecemos hoje. Eu já tinha falado nisto e descobri, entretanto, que o Google disponibiliza uma API de representação de dados estruturados.

Consigo pensar numa série de brincadeiras para isto :) Imaginem, por exemplo, juntar isto tudo, logo agora que a Wikimedia vai estar empenhada em manter os conteúdos disponíveis no Amazon Public Data Sets!..

Olhem aqui um exemplo do que pode ser feito, desta vez com Hadoop e Hive: Hot Wikipedia Topics, Served Fresh Daily.

"A" votação ou "A" hora

08:57, Tuesday, 11 2009 August UTC

Há muito tempo em conversa informal que uma votação do fair use deveriam ser verificadas todas as contas votantes... para se averiguarem quais os fantoches que por ali andariam.

De acordo com a heurística do rei-artur à partida muitos fantoches estão identificados, mas, daquilo que vi em termos de distúrbio mental enquanto fui verificador,  acredito que muitos se deram ao trabalho de conquistar o direito ao voto com proxys diferentes. E à partida palpitaria para resultados semelhantes aos do rei-artur, ambos os lados têm gente apanhada mas o pró dominaria. Sim, é discriminação e não sei que mais...

 

Citei, há muitos posts, e por outras palavras, que pela wiki.pt como na vida, "se queres ser bom, morre ou ausenta-te", há sempre os bons, os maus e os que se foram embora e são deificados.

Só há meses passei a ter net em casa, editei sempre do trabalho. Editei com o braço partido, editei do estrangeiro, editei quando estava de férias, editei quando estava a trabalhar durante o suposto período de férias, e com directas em cima, editei quando tinha dois trabalhos, e muitas outras gabarolices...

 

Foi giro. Não gosto muito do que leio, não suporto muito do que se passa, e como não tenho força nem um milionésimo do entusiasmo inicial, só mesmo o vício que me faz ler as polémicas e não os artigos, prefiro, como tantos outros, ir. A wiki.pt é grande, vai continuar a crescer, e eu, espero definhar de pequenino...

Duas perguntas...

09:00, Friday, 17 2009 July UTC

Quem apoia a ideia de que o Quintinense (leia-se Dbc2004, Joao666, Missigno, Quintinense) é/foi o maior caso de SP da wiki.pt? Só se forem os mesmos que acham que o Bizuim é/foi o maior troll da wiki.pt.

 

Quem acha que o Ozalid deve voltar e bloquear por infinito o Madeirense? Todos os que se riram da primeira pergunta.

 

E uma terceira, de retórica, quem será o Madeirense? Os mesmos de antes sabem perfeitamente a resposta a esta pergunta, os "jovens" nem sonham o que está por trás.

 

A wiki.pt é dos poucos locais onde o ambiente ficou menos poluído nos últimos anos. Espero que não tenha sido por ter saído :S

 

 

Endereço novo

22:14, Thursday, 16 2009 July UTC
A ideia era antiga, mas eu não tinha tempo para colocá-la em prática. O Blogger desde sempre não me agradou muito como serviço. É incompleto e muito abandonado por uma empresa que tem produtos demais. Daí havia o WordPress com muitos mais e melhores recursos e em código aberto (o que não significa muito para mim além do apoio moral).

A partir de agora, portanto, só estarei contribuindo com uma empresa que planeja conquistar o mundo usando o YouTube, o Books, o Maps, o Reader (por sinal, a melhor invenção deles), o buscador (claro!) e nada mais. Juro.

O endereço antigo vai continuar no ar (porque há vários resultados no Google para quem procura sobre o Wikilivros ou livros didáticos :D e porque eu tenho medo que o roubem. Nah! Mentira).

Só acho estranho, muito estranho (ninguém mais acha?), que o WordPress use o serviço de propaganda do Google, seu maior concorrente, para se manter. Alguém já viu disso por aí? Empresa que faz propaganda do concorrente?

Para os que não querem saber de nada disso de endereços novos, em seguida, voltaremos com a programação normal. O endereço novo agora é: http://cultivandoojardim.wordpress.com Obrigado pela paciência de ler até aqui.

A sustentabilidade da Wiki.Br

21:50, Wednesday, 17 2009 June UTC

Fiquei deslumbrado com esta análise que vem perfeitamente no âmbito de alguns posts recentes da WikiEsfera, respondendo cabalmente aos posts: Wikidúvidas da Língua Portugueza; Pq o nível cultural da Wikipédia de língua Portuguesa é muitíssimo inferior ao de língua inglesa?; e a anterior versão do Culturas.

 

Sustentabilidade ou seja, é um ato de sustentar com habilidade por exemplo, aquele miserável do seu filho que não quer trabalhar e fica no sofá de sua própria humilde residência assistindo televisão e comendo seus devidos alimentos.Esse vagabundo é sustentado por sua coitada mãe que acaba fazendo um papel de radical por sustentar esse filho vagabundo com habilidade.

 

Vou ligar à minha mãe a pedir desculpa...

Pseudo-ciência

21:00, Tuesday, 09 2009 June UTC

Como qualquer bom ouvinte de Gabriel o Pensador desconfio das, digamos, "igrejas". Como qualquer bom português desconfio das instituições. Como qualquer bom lusófono desconfio (e tenho a certeza) que noutro sítio qualquer as coisas são melhores.

 

Portanto admiro imenso a decisão do ArbCom.en pela frontalidade e quasi-unanimidade da decisão, sabendo que iria ter uma certa repercussão! Até pela velocidade...

Arbitrar

08:43, Friday, 15 2009 May UTC

Arbitrar é difícil, sempre que um jogador perde é o árbitro que leva na cabeça, só depois se questiona a táctica do treinador e a técnica dos jogadores...

 

Mas arbitrar em câmara lenta (ou aliás, não arbitrar de todo) é por-se a jeito de qualquer treinador de bancada criticar, como eu, senão vejamos.

 

Hoje, todo o mundo aguarda.

 

Sei que dá/pode ter dado muito trabalho , que é muita discussão e muita gente que tem de responder antes de se tomarem decisões, vivi tudo isso e compreendo. Mas, quase-3 meses para ainda não ter produzido uma decisão num conselho que é eleito por 12, está visto qual o limite máximo de casos complexos que podem ser avaliados.

 

Recordo que a demora não benificia a justiça, desacredita-a. E no caso este conselho está morto.

Concorrência

23:59, Thursday, 23 2009 April UTC
Um elemento muitas vezes desconsiderado ao se analisar a popularização da Wikipédia é a concorrência, ou a falta dela. Não estou dizendo que não existissem enciclopédias e enciclopédias online, mas em sua maioria elas tinham, e continuam tendo, algum tipo de restrição ao conteúdo. Fosse que ele fosse pago, fosse que não pudesse ser copiado, não existia nada semelhante à Wikipédia. Não existia em inglês e menos ainda em outras línguas, inclusive o português.

Sob este ponto de vista, o da concorrência, o que vemos se analisamos os demais projetos da Wikimedia? Tentarei aqui me colocar no lugar de uma pessoa que não conhece os outros projetos mas busca algum tipo de informação que eles fornecem, como notícias, no caso do Wikinotícias, ou livros e poemas, no caso do Wikisource.

Me parece muito óbvio que o mais prejudicado em relação à concorrência é o Wikinotícias. A concorrência é muito grande para o projeto. Quem, do público em geral, preferiria deixar de utilizar sites da grande mídia, em teoria confiáveis, para passar a utilizar o Wikinotícias para se informar? A não ser que se queiram notícias alternativas, menos comuns nos grandes meios, mas mesmo para isso há sites especializados e já mais conhecidos como o Centro de Mídia Independente.

Ironicamente, o Wikinotícias também sofre concorrência da própria Wikipédia, e isso apesar de ser o único projeto da Wikimedia que tem uma ligação destacada para si na página principal da Wikipédia ("Veja mais no Wikinotícias"), e pelo seguinte: quando a grande mídia faz muito alarde de algum acontecimento, onde o público acha que a informação deve estar? No Wikinotícias? Não! Cria-se um verbete na Wikipédia.

Os argumentos favoráveis não importam, seja que a informação pode estar mais completa e por isso cabe na Wikipédia, seja que a notícia tornou-se histórica. O que acontece, como já vimos, várias vezes (por exemplo: o do voo Gol 1907 e a respectiva página de eliminação), é que as pessoas editam na Wikipédia e não no Wikinotícias.

Depois do Wikinotícias, o projeto que me parece mais prejudicado é o Wikisource. Supondo que alguém estivesse procurando textos de quem se lembraria? Muito provavelmente de outros projetos com a finalidade de reunir livros como o Project Gutenberg ou o Domínio Público que, por ser do governo, conta com divulgação "gratuita". Não importa também que alguns conteúdos deste último não estejam em domínio público e não possam ser livremente utilizáveis. Mas deixemos a discussão sobre as liberdades (no caso, a dos direitos autorais) e as vantagens das wikis para o final.

Já o Wikiquote e o Wikcionário sofrem o mesmo tipo de concorrência, a de páginas "sem marca", isto é, páginas que enumeram citações ou que dão a definição de palavras, apenas como subproduto da propaganda. Basta procurar citações por aí. Para os que leem, há vários dicionários de citações publicados e dicionários comuns online e impressos disponíveis por aí, mais completos - por enquanto - e mais confiáveis - em teoria - por serem tradicionais e terem autoridades por trás de si.

Sobre o Commons não sei se vale a pena falar, já que os usuário dele o fazem tão bem. Mas em resumo pode-se dizer que há muitos outros serviços de gerenciamento de imagens, que eles possuem interface mais amigável, são mais fáceis de utilizar e não possuem a limitação de carregamento de imagens com finalidade educacional (nem com direitos autorais...).

A Wikiversidade não tem concorrentes diretos, apenas as redes internas de algumas universidades que utilizam o Moodle, mas é muito nova e tem pouco conteúdo ainda. Além do mais, os professores parecem preferir, até agora, desenvolver projetos na Wikipédia e no Wikilivros.

E o Wikilivros? Não há, que eu saiba, em língua portuguesa, outros projetos que pretendam escrever livros didáticos, manuais e apostilas colaborativamente, nem que os disponibilizem na internet sob uma licença livre. Apesar de haver páginas que disponibilizem materiais didáticos, como a da Biblioteca Virtual do Estudante de Língua Portuguesa da USP. Mesmo assim, o Wikilivros também conta com a concorrência da própria Wikipédia. Se a informação está disponível mais facilmente na vizinha para que se dar ao trabalho? Tanto é assim, que muitos usuários novos querem copiar conteúdo da Wikipédia para o Wikilivros integralmente, sem modificações.

O que nós podemos fazer então? Quais são os nossos diferenciais?

Talvez sermos projetos wiki e disponibilizarmos nosso conteúdo sob licenças livres possam considerados diferenciais por quem vê os projetos de dentro, mas não acho que estas características sejam vistas assim pelo público em geral. A maioria das pessoas não está nem aí para direitos autorais, muito menos na internet, que no Brasil é considerada terra sem lei. E não acho que as vantagens de ser wiki sejam muito claras. Pelo contrário, claras são as desvantagens, como o vandalismo, que é o que mais chama a atenção quando se fala que "qualquer um pode editar" o conteúdo.

Pessoalmente, acho que para nos destacarmos da concorrência temos que cobrir o que a concorrência não cobre, ou fazer o mesmo que ela, mas de forma diferente, sempre com a qualidade em mente. Por exemplo, o Wikisource pode investir na tradução de obras inéditas em português ou disponibilizar a obra de autores menos conhecidos. Enquanto o Wikilivros pode apostar no didatismo e em conteúdos para os quais livros didáticos em português sejam inexistentes, como o ensino de sueco. É preciso procurar as brechas e ser criativo.

Vale lembrar, para terminar, que a própria Wikipédia lusófona sofre concorrência... Da Wikipédia anglófona! E quando é que ela se destaca? Quando o usuário não tem opção, isto é, nos assuntos lusófonos.

Concursos

08:11, Thursday, 16 2009 April UTC

Já há muito tempo que afirmei que as boas-intenções de quem quer arregaçar as mangas e fazer algo de produtivo são normalmente inconsequentes, ou pior, ignoradas, deixando o ingénuo a falar sozinho.

 

Quando o rei-artur organizou o melhor WAT de sempre pela segunda vez pensei que havia vestígios de comunidade no meio das logins da wiki.pt. Rápido vi que seria um efeito pouco durável, mas foi muito giro para quem viveu aquele concurso por dentro. Empenho, seriedade, desportivismo e até a rebeldia na hora da avaliação dos colegas, um verdadeiro espírito de grupo.

 

Agora sim, a situação está muito mais normalizada. Arrastei-me umas horas da cama, para dar a mão possível a quem retirou ainda mais horas que eu... e sendo a avaliação posta à comunidade, poucos comentam/participam/votam nas votações dos artigos criados no WAT7.

 

Claro que assim o é. Isto obriga a um esforço sério de leitura e análise. O amandamento-de-bitaites nem ler o que já foi escrito precisa. E há prioridades, entre trabalhar e aparecer...

Apresentação

02:08, Friday, 27 2009 March UTC
Já está no Commons a apresentação desta terça-feira passada do Helder sobre o Wikilivros no "Debate: Direitos autorais e educação".

Esta foi a primeira apresentação lusófona exclusivamente sobre um projeto da Wikimedia que não a Wikipédia e os resultados parecem ter sido muito bons, inclusive já com alguma repercussão na mídia.

Vídeos das apresentações estarão disponíveis na página Observatório da Educação. Quero ver a nossa!

Evento: Direitos autorais e educação

20:22, Tuesday, 17 2009 March UTC
Na próxima terça-feira, dia 24 de março, vai ser realizado em São Paulo um dia de debates sobre "Direitos autorais e educação" e o Helder do Wikilivros foi convidado para falar sobre o projeto!

Não encontrei um site com a programação, então segue como me foi passada:


9h30 - 11h30
Mesa 1 - Livro didático e acesso ao conhecimento
Célia Cassiano - Autora da tese de doutorado "O mercado do livro didático no Brasil"
José de Nicola Neto - Autor de livro didático e presidente da Associação brasileira dos autores de livros educativos (ABRALE)
Coord.: Pablo Ortellado - Grupo de pesquisa em políticas para acesso à informação (GPOPAI/USP) 13h30 - 15h30

Mesa 2 - Experiências de material didático para livre acesso
Jairo Marçal - Coordenador do Livro didático público: Projeto Folhas da Secretaria de Estado da Educação do Paraná
Hélio Kuramoto - Coordenador geral de pesquisa e manutenção de produtos consolidados do Instituto brasileiro de informação em ciência e tecnologia (IBICT): Ministério da Ciência e Tecnologia
Helder Geovane Gomes de Lima - Colaborador do Wikilivros
Coord. Vera Masagão Ribeiro - Coordenadora de programas da Ação Educativa 16h - 18h

Mesa 3 - Indicações para a formulação de políticas públicas
Pablo Ortellado - Grupo de pesquisa em políticas para acesso à informação (GPOPAI/USP)
Egon Rangel - Membro da comissão técnica do livro didático: Ministério da Educação
Jamila Rodrigues Venturini - Jornalista
Coord: Sérgio Haddad - Coordenador geral da Ação Educativa

Quando: 24 de março de 2009, das 9h30 às 18h
Onde: Auditório da Ação Educativa
Rua General Jardim, 660, Vila Buarque, São Paulo-SP
(próximo à estação do Metrô Santa Cecília)


Os temas parecem muito interessantes e não conhecia ainda o movimento pelo acesso livre a informação científica, tema de estudo do palestrante anterior ao Helder.

As inscrições podem ser feitas pelo e-mail candelaria [arroba] acaoeducativa.org e são gratuitas. O evento é uma parceria entre uma ONG e o Grupo de Pesquisa em Políticas Públicas para o Acesso à Informação (GPOPAI) da USP. Agora temos os professores de que eu falava no texto anterior!

Dia Nacional do Livro Didático

13:16, Sunday, 01 2009 March UTC
Dia 27 de fevereiro último foi, no Brasil, o Dia Nacional do Livro Didático. Creio que é como outras datas comemorativas de que ninguém sabe e que, portanto, ninguém comenta.

No Brasil os livros didáticos são distribuídos gratuitamente para as escolas pelo governo federal desde que o Programa Nacional do Livro Didático (PNLD) foi criado em 1985. Contudo, esta distribuição gratuita só envolvia o ensino básico até que em 2004 começou a ser ampliado para incluir também o ensino médio ou ginasial.

O PNLD gerou uma verdadeira indústria do livro didático no Brasil. Sendo a distribuição nacional, as encomendas do governo são da casa dos milhões e qualquer editora hoje quer entrar em um mercado com uma tiragem tão alta e tão certa. Todavia, a avaliação dos livros que chegarão a um catálogo final nas mãos dos professores é feita nas universidades e os critérios de seleção são bastante rígidos. Na área de História, por exemplo, são avaliados "Princípios pedagógicos", "Princípios históricos", "Projeto gráfico" e "Elementos para contrução da consciência cidadã", todos itens com subdivisões.

Essas exigências geraram um alto grau de profissionalização do material, devido também a concorrência entre as editoras. Mesmo assim, os livros didáticos não escapam de erros ou falhas e estes de serem escancarados de vez em quando na imprensa. Por exemplo, recentemente, por ocasião dos 40 anos do início do AI-5 a Folha Online publicava matéria sobre o assunto.

É difícil ver o Wikilivros entrando neste mercado. É difícil cumprir certos tópicos do processo de avaliação como a exigência de que os livros venham em coleções para abarcar todo o ensino básico, desde a primeira série até a última, ou a exigência de que venham com manuais para os professores. Eu diria que com a mão-de-obra disponível é impossível. Uma possível brecha está nos livros infantis que servem mais como complemento ao livro didático do que como concorrência. Uma outra está no conteúdo desenvolvido para vestibulares e concursos como também para cursos universitários.

No caso das universidades, em particular, o Wikilivros é muito apropriado, pois os próprios professores podem escrever seus livros e apostilas, já que não há exigências governamentais quanto ao material utilizado no Ensino Superior, e há ainda o estímulo de que livros no Brasil, didáticos ou não, custam muito caro, de maneira que fica faltando só a divulgação do projeto.

É proibido adjectivar

10:57, Saturday, 28 2009 February UTC

Há muitos muitos anos, ainda os animais falavam, lembrei-me de perguntar a uns amigos porque não se punha em votação uma proibição de adjectivar.

 

Se eu quero falar de ti digo, {{usuário|nome_de_usuário}} fez isto e aquilo, não, o "adjectivos_1" do {{usuário|nome_de_usuário}} que não passa de um "adjectivos_1" fez "advérbios_de_modo_1" uma "adjectivos_3" que consistiu em "adjectivos_4" bloquear o "adjectivos_5" {{usuário|nome_de_usuário2}}. Claro que era logo invocada a figura do censor, e ninguém aprovaria...

 

Mas mau mau é ler a esplanada (aquela vez no ano em que uma pessoa de enche de coragem e lá vai) e ver só ataques pessoais e muita muita porcaria.

 

Sem adjectivos e ataques pessoais a comunicação ganhava conteúdo... Mas se os ataques pessoais estão proibidos há muito e continuam a estar presentes, não vale a pena pensar em retirar os adjectivos.

Apologia da gralha pública

18:59, Wednesday, 11 2009 February UTC

Até por ter sido durante muito tempo o jornal disponível no meu local de trabalho, habituei-me a ler o Público. Além de gostar e lê-lo online, que as vacas estão magras, tenho ainda de fazer outra nota.


É, de longe, o melhor jornal a fazer cobertura do mundo da net e multimédia, até o site tem avanço largo face a muitos da concorrência.

Se calhar foi azar, possivelmente pressa. Inevitavelmente veio à baila, e muita pancada levou o ceguinho, mas as razões deviam claramente ter sido outras...

 

O Público é de longe o melhor, e praticamente o único, a acompanhar esse fenómeno que (como o Rei-Artur regularmente informa) está no top-5 das buscas dos internautas portugueses, portanto a Wikipédia agradece-lhe o merecido destaque!

 

Uma gralha, é uma gralha é uma gralha!

O efeito esquecimento

16:03, Monday, 09 2009 February UTC

Seguindo-se à análise do efeito Alvim lembrei-me de ver a velocidade de esquecimento do mesmo, medindo o número de visitantes. O que é interessante tendo em conta a presença de podcasts no sítio da antena 3. A prova oral foi dia 21 e no dia 31 o artigo do Alvim, voltou a ter a vintena de visitas habituais.

 

1 - A curva de descida de 21 a 25 seguiu uma exponencial com quadrado do coeficiente de correlação momentânea do produto Pearson (R2, medição do ajuste da aproximação aos dados) 0.947 e uma constante de tempo de 1.64 dias (muito rápida a dissipação), enquanto que uma regressão logarítmica tem 0.965 e (uma muito poderosa) regressão quadrática atinge 0.997.

 

2 - A curva de 26 a 31 tem um R2 da exponencial (com constante de tempo 3.7 dias) com 0.640 e da quadrática com 0.860

 

3 - A totalidade dos dias tem um R2 da exponencial (com constante de tempo 4 dias) com 0.751, da logarítimica com 0.805 e da quadrática com 0.806.

 

Conclusões?

A dissipação foi bem rápida (exponencialmente…) nos primeiros 5 dias, mas nos dias 26 a 30 o número de visitas estabilizou (responsável pela falta de adequação da exponencial e possivelmente motivado pelo podcast). Espero que os visitantes tenham ficado bem impressionados e tenham navegado por outros artigos, e não que tenham deixado de vir à wikipédia.pt.

 

Motivos?

Pessoal que ouviu o podcast com algum atraso. Pessoas que tentaram aceder para ver se já era possível vandalizar o artigo. Pessoas da antena 3 e da família do Alvim que se lembraram de voltar para ver o estado do artigo.

 

Efeitos e observações

Esquecimento exponencial com estabilização intermédia descreve bem o tipo de dinâmica imaginável: os ouvintes do directo, os que se lembram e vão confirmar no dia seguinte, e no outro, até aos últimos ouvintes do podcast, a partir daí volta ao normal. É curioso ver que a dissipação não foi total, por exemplo no início de Fevereiro o artigo do Alvim tem (embora irregular) uma média superior à de Janeiro. Presumo que sejam pessoas que retiveram um pouco mais tempo o tópico do programa e ficaram com um certo “bichinho” da coisa.

 

Para o futuro

Só me resta imaginar o quanto não cresceria em conteúdo e consideração/reconhecimento em Portugal a wiki.pt se houvesse um trabalho mais forte (à la wiki.de)… Assim, o efeito de cada visita à comunicação social traria editores, defensores da qualidade da nossa wiki e efeitos muito mais fortes a curto prazo e visíveis a longo prazo.

 

A nossa batalha será o aumento da constante de tempo já que será muito difícil fugir a este grau de semelhança com a exponencial.

O efeito Alvim

12:00, Friday, 23 2009 January UTC

Porque a ida ao programa foi quase tão importante como o vandalismo em directo, fica um resumo do efeito da fugaz passagem do tema Wikipédia na Prova Oral.

 

O artigo Fernando Alvim tinha sido visto por 24 vezes dia 20, dia 21 foi visto 928 (e há o efeito de arrastamento que não vou contabilizar mas fica nesta ligação).

A discussão do artigo tinha sido vista 5 vezes no mês foi vista 93 dia 21.

O senhor Fernando Gui de São-Payo de Sousa e Alvim, que deve ter muitas visitas devidas ao ser estupendo nascido no quarto 404 do hospital de Mafamude, passou de 2 para 27.

A própria Antena 3 passou de 14 para 62, quando no dia em que fui às manhãs da 3 foi vista por 45 (muitas deverão ter sido pela ligação do anúncio na esplanada)

 

Certamente arrasador seria o número de pessoas que foram ao google procurar a expressão "hi5porcas"...

 

Espero que num futuro próximo, a Wikipédia possa ter uma "prova oral só para ela", e assim desfazer mitos e enganos que (como se ouviu nos últimos minutos de prova oral) persistem mesmo entre gente bem informada.

O efeito antena 3

14:39, Friday, 16 2009 January UTC

Um artigo referido na entrevista foi o de José Sócrates por causa desta reversão feita em directo na rádio. Um outro, bem mais importante, foi o de Edu da Gaita.

 

E que efeitos teve isto?

 

O José Sócrates passou de 138 para 247 visitas, 1,79 vezes mais.

O Edu da Gaita passou de 3 para 27 visitas, 9 vezes mais.

 

 

Parabéns ao Edu e à respectiva que o imortalizou!

Ensaio sobre a Lucidez

16:56, Tuesday, 30 2008 December UTC

Na wiki.pt, como noutras organizações disfuncionais, verifica-se que há um distanciamento de uma esmagadora maioria dos editores mais longevos.

Não só das discussões quentes, das revisões de políticas, das votações de reformas, e afins, mas infelizmente também da edição de conteúdo.

 

O desgaste provocado pelo acessório é demasiado forte para que o amor inicial ao conteúdo se mantenha. Seria preciso um retorno-dos-afastados, semelhante ao milagroso erguer dos doentes do livro, para que se viesse a conhecer um estado de coisas diferente, assim o caminho está traçado.

 

Até que as anti-autoridades abandonem a organização (sic) nada mudará.

Inventem-se novos administradores

03:04, Friday, 12 2008 December UTC

O penico da Wikipédia instalou uma política tão forte de "pedido de desnomeação/suspensão na hora" que gerou uma espiral de silêncio que ninguém se atreve a romper.

 

Ninguém pode bloquear um insulto, ninguém pode simplesmente dizer que não é obrigado a ler palavrões que não profere. Cacocratas criam interpretações rocambolescas de regras mais claras que a água.

 

Inocentes-óptimos-trabalhadores-e-experientes usuários com 3 a 4 artigos editados por cada 10 comentários verborrágicos e incendiadores, encolheram para um canto quem devia manter a educação no mínimo dos mínimos. De tal forma que cacocratas são agora inocentes-óptimos-trabalhadores-e-experientes usuários e há-2-dias-administradores-que-até-há-2-dias-eram-imparciais são agora censores de e para sempre.

 

As flamewars de origem peniquesca chegaram a um nível de descontrolo tal que a minha única sugestão é a auto-desnomeação generalizada acompanhada de auto-banimento a domínios que não o principal, os trolls que se auto-alimentem.

 

Concluíndo com uma citação que há 2 anos pareceria impossível (deveria, e quereria certamente, ter escrito: "mil vezes menos bestas"): Esse MC já torrou as paciências, como vocês ainda aguentam ele aqui? Se conseguiram me expulsar por coisas mil vezes mais bestas, por que não conseguem expulsá-lo daqui? Aqui não é local pra crianças, isto é uma enciclopédia.

Poderia ter sido... Um anônimo

01:53, Tuesday, 09 2008 December UTC

Foi a gota d'água. Já é a terceira ou quarta vez que me confundem com outro. Já houve confusões por causa disso e já até atribuíram minhas idéias a outras pessoas. Tudo bem que quatro mil edições - não, não dava boas-vindas - e quase dois anos de contribuições não são grande coisa, mas nem só de Esplanadas se faz uma comunidade.

Se há uns que querem deixar de ser IP e passar a ser alguém, eu queria deixar de ser alguém e passar a ser um IP. Talvez assim atribuíssem meus comentários e idéias a mim e ainda viraria assunto em blog.

Para o pessoal do fair use, a imagem prometida antes:

Jardim em Quioto, Japão.
Autor: Fg2 Licença: Domínio Público

Pronto, agora pode ser destaque... Não tem nem link vermelho.

Quem é filibusteiro?

22:08, Friday, 05 2008 December UTC
Não lembro de onde conheço a palavra, mas dei de cara novamente com ela recentemente e gostaria de compartilhar a informação, pois tem a ver com um assunto discutido no texto passado: a obtenção de consenso em wikis lusófonas.

Filibuster, nos Estados Unidos, é um indivíduo "obstrucionista", alguém que procura impedir ou obstruir os trabalhos parlamentares...

Já veem onde quero chegar. Já conhecem o tipo e agora teem o nome dele. Usem-no sabiamente. E não sejam filibusteiros...

Haverá mais filibusteiros em português do que em inglês?

Cacocracia I

10:56, Thursday, 27 2008 November UTC

A curva de relação de um utilizador com a wikipédia é gaussiana.

 

Primeiro um contacto suave, ao fim de várias semanas de interacção é que começamos a querer explorar as páginas para além dos artigos, perceber, compreender, decidir, votar, propor...

Até que depois queremos é fugir, demasiado ruído de fundo, demasiada confusão, demasiada mesquinhice, demasiada importância dada a subalíneas de propostas de ensaios (sim ensaios! não políticas, não artigos informativos, mas ensaios).

E então descobrimos a maravilha que é simplesmente editar artigos, reverter vandalismo, no muito-máximo encaminhar novatos... Um nível de interacção semelhante ao inicial.

 

Quem foge a esta distribuição? Só me lembro de um ex-burocrata que ainda se preocupa com políticas internas, mas mesmo assim, em proporção o contributo para o domínio principal é dominante. Ah, e claro, os vândalos e tróis.

 

 

Pela lei dos grandes números, converge-se em probabilidade para um acontecimento extraordinário: todos os usuários da Wikipédia um dia vão editar apenas o domínio principal.

 

O corolário: todas as discussões serão entre vândalos e tróis. Então é melhor deixar de visitar páginas de discussão e a esplanada, não vá ser o único não-vândalo-nem-troll que ainda lá anda!

Estilos culturais

21:42, Friday, 21 2008 November UTC
Cada wiki é diferente. São diferentes em suas regras, na forma de resolver problemas semelhantes, em suas comunidades. Ainda assim, parece que cada língua tem um estilo próprio de pensar, o que se reflete no conjunto das wikis delas.

Tempos atrás eu achava muito normal e até desejável copiar políticas da Wikipédia ou do Wikilivros anglófonos para os respectivos projetos lusófonos. Hoje, isso me parece um grande disparate absurdo.

Por exemplo: será que o consenso é realmente adequado a wikis lusófonas? Vejo que muitos se enganam sobre o que é o consenso, referem-se a ele como se fosse a opinião da maioria, uma unanimidade. Não é. Segundo um Aurélio velho que tenha aqui comigo, o consenso é "um acordo ou concordância de idéias, de opiniões [...]". Um a-cor-do! Para haver consenso, é preciso que as partes envolvidas em uma discussão cedam um pouco sempre a partir de suas opiniões originais para que se atinja um ponto neutro, um terreno neutro.

Mas muitos de nós chegam a discussões sempre com um ponto de vista determinado e nunca dispostos a mudá-lo. Eu sou eu, você é você. Eu sou o dono da razão, você está errado. Como ter consenso assim? Acho que isso tem muito a ver com um tal "orgulho ibérico" que Sérgio Buarque de Holanda, se não me engano, cita no Raízes do Brasil e que aqui no Brasil é responsável em grande parte pela nossa democracia incompleta, em que "todos são iguais perante a lei", mas uns são mais iguais que os outros.

E, minha nossa, como falamos, nós lusófonos! Sinceramente, não vejo isso em nenhuma outra wiki por onde passo; em especial, as anglófonas. Afinal, para que servem as wikis? Para discutir ou desenvolver conteúdo? Se a resposta for a segunda, verão que o trabalho a fazer por aí nem é muito... Apesar de saber que a dicotomia entre comunidade e conteúdo também é uma questão para os anglófonos, por exemplo, entre nós, ela se acentua. E quem disse que só há comunidade onde há discussão?

O que se quer é colocar e impor a própria opinião, não ouvir e entender a dos outros. São diálogos de surdos. Nas discussões também qualidade e tamanho são contrários. Li, por aí, que nós lusófonos temos o pensamento prolixo em comparação ao pensamento dos anglófonos - nosso pensamento não seria lógico por natureza - e que por isso, os métodos de ensino de leitura no Brasil dão errado (nem queiram saber a nota do Brasil em leitura no Programa Internacional para Avaliação de Alunos da OCDE...). Na hora, achei um absurdo, claro. "Lógico por natureza"?! Que diabos é isso? Mas os fatos teimam em negar a minha incredulidade... Parece que é bom ser prolixo no Brasil (e no resto do mundo lusófono também?)

Outra característica que me parece muito típica nossa é o nosso apego a leis, regras e interpretações. Tudo tem que estar no papel; nos mínimos detalhes; senão não vale, pode ser contestado e interpretado (sempre) longamente. É uma atitude muito contrária a dos anglófonos, de novo, com sua common law. E, por isso, como há os que entram em discussões apenas para discordar e para desfazer qualquer tentativa de consenso, talvez sempre haja alguém para perguntar "Onde está escrito que não pode?", mas nunca "Onde está escrito que pode?", e para contestar a validade de recomendações, por serem "apenas" recomendações, não regras, leis.

Dito tudo isso, talvez caiba agora uma última pergunta: será que wikis são adequadas aos lusófonos? Não digo que os projetos anglófonos, ou outros, sejam perfeitos, que o consenso nunca funcionará em português, que as votações fazem mais o nosso estilo ou que continuaremos discutindo tanto sobre o sexo dos anjos. Os outros projetos da Wikimedia em português ainda são muito pequenos para que se ponha isso a prova e agora nós podemos usar a Wikipédia como modelo para o que não se deve fazer. Pode ser que haja outras características nossas que me escapam e talvez nem todas elas sejam negativas. Seja como for, eu continuarei me negando a acreditar em "estilos culturais"...

Wikilivros portáteis e coleções

20:06, Monday, 27 2008 October UTC
Desde 23 de outubro os Wikilivros em todas as línguas ganharam três novas ferramentas: a criação automática de versões em PDF e de versões em ODT (OpenDocument Text) dos módulos e a criação de coleções. Eis o aviso "oficial".

Os recursos já estavam em testes - e eu havia brincado com eles um pouco -, mas a versão final, para uso, superou minhas expectativas. Achei as versões em PDF de alguns módulos muito bonitas e principalmente profissionais. E em se tratando de wikis esta é uma palavra importante.

As coleções são um agrupamento de módulos avulsos da preferência do usuário para que possam virar uma versão em PDF única ou para que o usuário possa encomendar para a PediaPress (empresa alemã responsável pela tecnologia) uma versão publicada deles. É claro que o recurso pode ser usado também para agrupar todos os módulos de um único livro para criar uma versão em PDF dele.

Contudo, ainda há problemas. Por exemplo, o de que o programa redimensiona todas as imagens em uma página, o que inclui as imagens que são usadas no Wikilivros para classificar módulos pelo estado de desenvolvimento, o que as faz ocupar enormes espaços desnecessariamente; ou o de que os autores e referências poderiam ser listados todos em uma página só para o caso de coleções, o que daria a elas maior aspecto de livro; ou - e mais grave - que a GNU FDL não é nem um pouco prática, porque não é nem um pouco prático ter uma versão em PDF de um módulo na qual o conteúdo propriamente dito ocupa uma página e a licença sete.

Por fim, gostaria de convidá-los a testarem as nossas novas ferramentas. E não fiquem com inveja: planeja-se levá-las para outros projetos da Wikimedia em breve.

Perguntas rápidas

02:15, Thursday, 16 2008 October UTC
Eis uma grande pergunta talvez apenas entendida completamente por quem edita em wikis pequenas:

Por que os novatos sempre somem depois de receberem qualquer mensagem?

Mesmo uma mensagem de boas-vindas ou uma tentativa de ajuda os assusta . O que nos leva, no caso do carregamento de imagens a:

Avisar ou não avisar acerca de toda a questão de direitos autorais?

Se se avisa, mesmo que em doses homeopáticas, perde-se um contribuidor; se não se avisa as imagens ficam sem licença...

Older blog entries