Artigo originalmente publicado por Vice em inglês.
Décadas antes dos tópicos do Twitter, fóruns do Reddit ou grupos do Facebook, existiam Usenet: um primeiro sistema de discussão na Internet, antes da Web, na qual você pode iniciar e participar de conversas muito semelhantes aos fóruns atuais de mensagens. Dirigido em 1980, a Usenet é a criação de dois estudantes da Universidade de Duke que queriam se comunicar por meio de servidores locais descentralizados e ainda está atualmente ativo.
Propaganda
Na Usenet, as pessoas falam sobre tudo, de ciências nanotecnológicas a sabonetes, vinho e OVNIs. Jozef Josciak, um arquiteto de sistemas que vive em Ontário, teve seu primeiro encontro com a Usenet em 2000, quando encontrou um emprego em período integral no Canadá, graças a uma oferta de emprego que encontrou lá.
Nesta semana, Josciak baixou algumas das publicações mais antigas do USENET disponíveis na Internet. Cerca de 2,1 milhões de publicações entre fevereiro de 1981 e junho de 1991 dos arquivos Henry Spencer Utzoo NetNews são depositadas no arquivo usenet para quem deseja consultá -las.
Este último pacote de informações arquivadas faz parte de um projeto ainda maior da Josciak. No mês passado, a Josciak lançou o site do USENET Archive como uma maneira de abrigar grupos independentemente dos grupos do Google, que também abriga grupos de imprensa como o Usenet. Atualmente, possui um arquivo de 317 milhões de publicações em 10.000 grupos USENET exclusivos, de acordo com o site. Jaosciak estima que eventualmente terá cerca de 1.000 milhões de publicações.
Henry Spencer, membro do Departamento de Zoologia da Universidade de Toronto, manteve arquivos de grupo em 141 bandas magnéticas. “As fitas Usenet Utzoo-Wiseman são essencialmente as primeiras discussões disponíveis publicadas na Internet por pessoas que trabalhavam em várias universidades e que já estavam conectadas à Internet”, disse Josciak.
Spencer e alguns colegas conseguiram transferir os dados de bandas magnéticas para o formato .Tar (Band Archive), e Josciak, que depositou publicações do USENET por anos, transformou essas bandas em um banco de dados Postgressql com capacidade de pesquisa completa, que mais tarde Mais tarde, ele foi ao site do USENET Archive. Ao longo do caminho, além de criar analisadores sintáticos para o arquivo de tira magnética da Utzoo, também desenvolveu conversores em PHP, JavaScript, Java e Python e os disponibilizou para todos em seu GitHub como recursos de código aberto que você pode usar.
Entre os grupos Utzoo, quase 26.300.000 publicações aumentaram e contam.
fonte: https://www.vice.com/es/article/pky7km/21-millones-de-las-publicaciones-mas-antiguas-de-internet-estan-ahora-disponibles-en-linea