Microformatos: conceitos, princípios e aplicações

Vanderlei Freitas Junior1 Daniel Fernando Anderle2 Alexandre Leopoldo Gonçalves3 4 Fernando OstuniGauthier DenilsonSell5

Resumo Pesquisadores e desenvolvedores enfrentam, na atualidade, o desafio de incluir semântica na , fazendo com que máquinas possam manipular mais facilmente as informações compartilhadas na rede. Diversas tecnologias surgiram com este propósito, entre elas os microformatos. Criados com o objetivo de proporcionar um padrão semântico para os dados publicados na Internet, observando ao mesmo tempo a necessidade de ser amigável aos humanos, na criação e anotação semântica utilizando-se desta tecnologia, bem como às máquinas, para que possam processar estas informações de forma a garantir maior capacidade semântica, agregando valor aos dados disponíveis na internet. No aniversário de sete anos da comunidade .org, mantenedora do padrão, o presente trabalho propõe uma revisita às origens dos microformatos, sua história, filosofia e principais especificações, procurando identificar as aplicações atuais baseadas nesta tecnologia. Palavras Chave: Microformatos. Websemântica

1 Instituto Federal de Educação, Ciência e Tecnologia CatarinenseSanta Rosa do Sul. juniordaniel@ifc- sombrio.edu.br 2 Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento. Universidade Federal de Santa Catarina. alexandre.gonç[email protected]. 3 Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento. Universidade Federal de Santa Catarina. [email protected]. 4Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento. Universidade Federal de Santa Catarina. [email protected]. 5Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento. Universidade Federal de Santa Catarina. dení[email protected].

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 9

1 INTRODUÇÃO

A internet vem ocupando um papel de destaque cada vez mais diferenciado na vida moderna. Inicialmente, a tecnologia previa a disponibilização de informações de forma estática e unilateral, isto é, o conteúdo produzido era apenas consumido pelo usuário, que não podia interagir com a sua fonte, nem tampouco com os demais usuários. Esta perspectiva foi sendo substituída por um novo paradigma, que passou a ser chamado de Web 2.0, quando o usuário assume papel ativo no processo e passa a também produzir conteúdo, interagindo com produtores e outros consumidores deste conteúdo. Novas ferramentas surgem para dar suporte a esta modalidade de utilização da internet, tais como blogs, wikis e ferramentas de colaboração diversas. Na esteira desta evolução, um grande volume de dados passa a ser produzido e disponibilizado na internet, e seu franco desenvolvimento fez com que se tornasse uma nova mídia de comunicação, ganhando cada vez mais importância em todo o mundo moderno (MARSHAL; SHIPMAN, 2003). O novo posicionamento cada dia mais consolidado da rede fez com que pesquisadores e desenvolvedores encarassem um novo desafio: incluir significado para os dados que são veiculados na rede. Berners-Lee, Hendler e Lassila (2001) afirmam que “a maior parte do conteúdo da web é desenvolvido para humanos lerem, não para programas de computadores manipularem com significado”. Esta constatação justifica a necessidade de um novo posicionamento de pesquisadores e desenvolvedores diante dos dados dispostos na Internet, na direção de adicionar-se significado a estes dados, tornando-os mais facilmente acessíveis à manipulação pelas máquinas que, por sua vez, poderão fornecer respostas mais adequadas e contextualizadas às demandas dos humanos. Uma simples pesquisa na internet por um telefone, ou endereço de uma companhia, pode ser mais efetiva e retornar dados muito mais específicos, se as máquinas pudessem ter a condição de identificar quais dados dentro de uma página se referem ao endereço, ao nome da cidade, ao código postal ou ao telefone da empresa procurada, tarefa muito simples para um ser humano, mas não tão trivial para um computador. Como forma de oferecer uma alternativa à necessidade de criar-se significado

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 10 para os dados disponíveis na internet, nascem os microformatos, criados com o objetivo deproporcionar um padrão semântico para os dados publicados na Internet, observando ao mesmo tempo a necessidade de ser amigáveis aos humanos, na criação e anotação semântica utilizando-se desta tecnologia, bem como às máquinas, para que possam processar estas informações de forma a garantir maior capacidade semântica, agregando valor aos dados disponíveis na internet. Neste contexto, e valendo-se do aniversário de sete anos da comunidade microformats.org, mantenedora do padrão, o presente trabalho propõe uma revisita às origens dos microformatos, sua história, filosofia e principais especificações, procurando identificar as aplicações atuais baseadas nesta tecnologia. Considerando o estado da arte, o presente trabalho apresenta como contribuições principais a sistematização teórica relacionada ao tema bem como a explicitação das principais aplicações atuais dos Microformatos, tais como das companhias Google e Facebook, gigantes do mundo da internet e que mantém viva a ideia de anotação semântica através dos microformatos. Para melhor compreensão, o presente artigo está organizado da seguinte maneira: a seção 2 apresenta a Web Semântica e a necessidade de dar significado aos dados presentes na internet. A seção 3, por sua vez, procura apresentar o tema dos microformatos, sendo seguida pela seção 4, que apresenta um resgate conceitual e histórico acerca da técnica. A seção 5, e suas subseções, detalham os padrões adotados pelos principais microformatos em uso na atualidade. Na seção 6, o leitor encontrará as principais aplicações da tecnologia. A seção 7, por sua vez, apresenta algumas alternativas aos microformatos e que tenham o mesmo propósito de oferecer semântica à web. Por fim, a seção 7 sintetiza o artigo e realiza considerações finais acerca do assunto.

2 WEB SEMÂNTICA

A Web Semântica congrega um conjunto de tecnologias que visam proporcionar significado aos dados publicados na web, permitindo que as máquinas possam processá- los de forma mais efetiva, levando-se em consideração a semântica presente, para executar tarefas mais sofisticadas.

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 11 A internet conta hoje com um grande volume de dados, publicados em suas páginas ao redor do mundo, entretanto, este conteúdo foi desenvolvido e está armazenado de forma a ser compreendido por humanos apenas, não por programas de computador. A possibilidade de que máquinas possam passar a compreender o significado e as relações existentes entre os dados publicados na internet descortina uma gama de novas aplicações que podem ser desempenhadas por computadores e sistemas, no sentido de facilitar a vida humana. Berners-Lee, Hendler e Lassila (2001) afirmam que a “Web Semântica vai trazer estrutura para conteúdo significativo de páginas na Web, criando um ambiente onde agentes de software itinerantes possam facilmente executar tarefas sofisticadas para o usuário”. Os autores citam um exemplo da necessidade do agendamento de um tratamento de fisioterapia para um paciente. Uma aplicação consultaria, automaticamente, as clínicas de fisioterapia que oferecem o tratamento específico prescrito pelo médico, mais próximas da casa do paciente, e que aceite seu plano de saúde. Ao conseguir as informações necessárias, a aplicação realiza também o agendamento do compromisso, desmarcando e reorganizando sua agenda para permitir que possa deslocar-se até a clínica. Este exemplo trata-se de uma alegoria das possibilidades da Web Semântica, posto que um grande caminho ainda precisa ser trilhado para que possamos atingir este patamar de integração e significação dos dados disponíveis na web, entretanto, os autores apontam um caminho. Marshal e Shipman (2003), por sua vez, apontam a Web Semântica como a nova era da Web. Para os autores, a Web Semântica é o crescimento de muitos desejos e influências, todos com o objetivo de fazer melhor uso da Web como padrão. Constata-se uma grande desordem dos dados publicados na Internet, e uma possível reorganização destes dados podem trazer um caminho para a aplicação semântica da Internet (MARSHAL; SHIPMAN, 2003). Então, a Web Semântica permite às máquinas interpretarem, combinarem e usarem dados presentes na Web, uma vez que estes dados passam a ser compreendidos por estas máquinas (OREN et al, 2012). As bases para a Web Semântica passam, então, a ser a descrição dos recursos da

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 12

Web de forma compreensível pelos computadores. De acordo com Oren et al (2012), esta descrição de pode ser obtida através da anotação de recursos com metadados. Esta anotação cria, então, relações entre os recursos na web, dando-lhes significado. Anotação pode ser definida, então, como “agregar dados a outros pedaços de dados” (OREN et al, 2012). Existem diversas ferramentas e metodologias para a anotação semântica de recursos da Web, tais como Wikis Semânticas, Blogs Semânticos e Tagging. Este último permite aos usuários a associação de uma ou mais tags para um recurso da web, expressando algum tipo de relação entre este recurso e o significado do termo (OREN et al, 2012). Os microformatos, por sua vez, apresentam-se como uma possibilidade de anotação semântica de determinados conteúdos na Internet, permitindo que estes dados ganhem significação e possam ser manipulados pelas máquinas semanticamente.

3 MICROFORMATOS

Os microformatos surgiram, de acordo com Allsopp (2007), em 2004, na conferência SouthbySouthwest (SxSW), com o lançamento do XHTMLFriends Network (XFN). A conferência SxSW constitui-se em um festival de cinema, música e tecnologia, realizado na cidade de Austin, estado do Texas, nos Estados Unidos, sendo palco do lançamento de diversas tecnologias inovadoras. Na época, o movimento dos blogs estava em franca expansão, e autores de todo o mundo passavam a anotar suas postagens com o objetivo de indicar suas relações com outros autores, de blogs dos quais se inspiravam. O XFN foi então desenvolvido com o objetivo de garantir esta anotação semântica, estabelecendo estas ligações de forma mais padronizada, tornando-se muito popular entre os autores de blogs (ALLSOPP, 2007). O sucesso do XHTML Friends Networké, então, apontado por diversos autores como o responsável pela popularização dos microformatos, sendo citado como o seu primeiro padrão estabelecido.

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 13 Atualmente, a tecnologia é mantida pela comunidade Microformats.org (figura 1). Fundada em 25/06/2005, constitui-se a maior referência mundial no assunto, tendo comemorado, recentemente, seu sétimo aniversário. A comunidade é composta pelos pioneiros em microformatos, como TantekÇelik, Kevin Marks, Ryan King, Eric Meyers, Matthew Mullenweg e Brian Suda, importantes nomes no cenário tecnológico mundial, reconhecidos por feitos como o desenvolvimento do WordPress, conhecida aplicação de blog, ou por participações junto ao W3C, o consórcio mantenedor dos padrões da Web. Além de seus fundadores, a comunidade intitula-se como aberta e conta com o apoio de colaboradores ao redor do mundo que contribuem com o crescimento e aprimoramento dos padrões definidos, garantindo a expansão da utilização dos microformatos.

Figura 1. Marca da comunidade Microformats.org. Fonte: MICROFORMATS.ORG (2012)

A seguir, apresentaremos os conceitos, filosofia e princípios inerentes aos microformatos.

4 CONCEITO, FILOSOFIA E PRINCÍPIOS DOS MICROFORMATOS

Os microformatos são conceituados de acordo com MICROFORMATS.ORG (2012)6 como um conjunto simples de dados formatados abertos:

Projetado primeiro para seres humanos e máquinas em segundo lugar, microformatos são um conjunto simples de dados formatados abertos construídos sobre as normas existentes e amplamente adotadas. Em vez de jogar fora o que funciona hoje, microformatos pretendem resolver os problemas mais simples primeiro, adaptando-se os comportamentos atuais e padrões de uso (por exemplo, XHTML, blogs).

6 Site da INTERNET da comunidade microformats.org. Pelo ano se chega às referências utilizadas neste artigo.

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 14

Com o intuito de ampliar a compreensão acerca do conceito de microformatos, a comunidade afirma que os microformatos são:

- Uma maneira de pensar sobre os dados. - Princípios de concepção de formatos. - Adaptado a comportamentos atuais e padrões de uso. - Altamente correlacionada com XHTML semântico, AKA the real world semantics, AKA lowercasesemantic web, AKA lossless XHTML. - Um conjunto de padrões simples de dados abertos formatos que estão ativamente em desenvolvimento e implementação para mais/melhores blog´s estruturados e publicação de microconteúdo web em geral. - "Uma revolução evolutiva"

MICROFORMATS.ORG (2012) ainda afirma o que não são os microformatos:

- Uma nova linguagem. - Infinitamente extensível e aberto. - Uma tentativa de fazer com que todos mudem seu comportamento e reescrevam suas ferramentas. - Uma abordagem totalmente nova que joga fora o que já funciona hoje. - A panaceia para todas as taxonomias, ontologias, e outras abstrações. - Defininição para o mundo inteiro, ou mesmo apenas fervendo o oceano.

Percebe-se, de acordo com Mrissa, Al-Jaba e Thiran (2008), que os microformatos oferecem como benefício a análise automática de informação na web. Por outro lado, permitem também a exportação de informação padronizada para aplicações externas. Oferecem ainda a possibilidade do seu uso por humanos através de plugins disponíveis para os navegadores atuais, permitindo, por exemplo, que a informação de um evento disponível em um site da Web no padrão de microformatos, seja importada automaticamente por um novo compromisso na agenda do usuário criado com os dados do evento. Khare (2006) e Stolley (2009) acrescentam que microformatos são uma nova abordagem para a codificação de informação semiestruturada usando XHTML, permitindo a descrição de pessoas, lugares, eventos e outros tipos comuns de informações de forma legível aos humanos. Desta forma, pode-se concluir que microformatos são metodologias para disponibilizar dados na internet, de forma a dar-lhes significado. Possuem abrangência limitada, determinada por padrões desenvolvidos e aprovados pela comunidade que os mantém.

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 15 Entretanto, o desenvolvimento de microformatos é baseado em um conjunto de princípios, especificados pela comunidade MICROFORMATOS.ORG (2007):

- Resolver um problema específico. - Iniciar o mais simples possível. - Projetado para os seres humanos em primeiro lugar, para as máquinas de segundo. - Reutilizar blocos de construção de padrões amplamente adotados. - Modularidade / incorporabilidade. - Permitir e incentivar desenvolvimentos descentralizados de conteúdos, serviços.

Desta forma, os microformatos devem ser pontuais e específicos, procurando abarcar questões restritas ao escopo de um problema específico, sendo o mais simples possível na seleção das técnicas para a solução deste problema. Devem ser fáceis o suficiente para serem compreendidos por humanos, mas efetivos para a interpretação por máquinas, permitindo a reutilização de seus códigos integral ou parcialmente.

O uso de microformatos possui um conjunto de benefícios. Inicialmente, Allsopp (2007) aponta o fato de que os microformatos não requerem grandes esforços para a adoção de novas tecnologias, posto que são construídos a partir de tecnologias já consolidadas, como o HTML, não exigindo, também, o desenvolvimento e a aprendizagem de novas ferramentas para a implementação da anotação semântica baseada em microformatos. Por outro lado, visto que os microformatos utilizam-se de esquemas existentes, sempre que possível, permitem perfeita integração entre aplicações baseadas na Web e aplicações desktop, tais como aplicativos de gerência de contatos, compromissos, e-mails, entre outros. Por outro lado, há que se elucidar algumas limitações dos microformatos. Khare e Çelik (2006) ensinam que os microformatos podem codificar informações explícitas, permitindo sua compreensão pelas máquinas, entretanto, não são capazes de possibilitar a representação de conhecimento implícito, análises ontológicas ou inferências lógicas. Os princípios conceituais e filosóficos de implementação dos microformatos fazem deles soluções relativamente simples, para a solução de problemas pontuais, agregando semântica aos dados disponíveis na Web e permitindo a integração destes dados com aplicações desktop. Estas características poderão ser verificadas na descrição dos principais microformatos verificadas na seção seguinte. Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 16

5 OS PRINCIPAIS MICROFORMATOS

Os microformatos são mantidos, como já mencionado anteriormente, por uma comunidade aberta que conta com a colaboração de pessoas de todo o mundo. Esta comunidade chama-se Microformatos.Org e mantém, atualmente, com cerca de nove microformatos classificados como estáveis: hCalendar (eventos e compromissos), hCard (dados pessoais), rel-license (licenças), rel-nofollow (comunicação com agentes), rel-tag (identificadores), VoteLinks (concordância com links), XFN (relacionamentos entre pessoas), XMDP (metadados) e XOXO (especificação de HTML). Além dos microformatos classificados como estáveis, a comunidade também mantém uma relação de especificações em desenvolvimento, chamados de rascunhos (drafts). São eles: adr (endereços), geo (coordenadas geográficas), hAtom (informações semânticas), hAudio (conteúdo de áudio), hListing (listas abertas e distribuídas), hMedia (imagens, vídeo e áudio), hNews (informações semânticas em notícias), hProduct (informações padronizadas sobre produtos), hRecipe (receitas culinárias), hResume (currículos), hReview (revisões), rel-directory (indica que o destino de um hyperlink é um diretório), rel-enclosure (anexos), rel-home (indica umlink para a página principal de um site), rel-payment (mecanismo de pagamento), robotsexclusion (informações para robôs de busca) e xFolk (marcações sociais). A seguir, analisaremos alguns dos principais microformatos disponíveis e estáveis, compreendendo suas principais propriedades e exemplos de uso. Analisaremos também o formato hRecipe que, embora não classificado pela comunidade Microformats.org como estável, mas já encontra aplicação na implementação de uma busca específica da Google.

5.1 Microformatos de contatos: hCard

O microformatohCard é utilizado para fazer a anotação de endereços de pessoas e companhias, tendo como base o padrão vCard de dados pessoais. É identificado pela classe raiz vCard, e é composto pelas seguintes propriedades principais:

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 17 Quadro 1. Propriedades principais de hCard Fn Nome complete (obrigatório) N Nome estruturado (obrigatório) honorific-prefix Prefixohonorífico: Ms., Dr. given-name Primeironome additional-name Nome do meio family-name Últimonome honorific-suffix Sufixohonorífico: PhD. Nickname Apelido Org Companhia, organização Photo Foto, ícone, avatar url Site destecontato email Endereço de e-mail tel Número de telephone adr Endereçoestruturado street-address Nome da rua, número, apto Locality Cidade Region Estado postal-code Código postal country-name Nome do país bday Data de aniversário category Categoria do contato note Notassobreestecontato Fonte: Microformats.org (2012)

Vê-se a seguir um exemplo de implementação de um hCard, extraído de Microformats.org (2012):

Sally Ride ( Dr. Sally K. Ride Ph.D.), sallykride (IRC)
Sally Ride Science
w,
+1.818.555.1212
123 Main st.
Los Angeles, CA, 91316
U.S.A
birthday
physicist
1st American woman in space.

A comunidade Microformats.Org mantém criadores de microformatos, Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 18 desenvolvidos a partir das especificações de cada padrão mantido por ela. A figura 2 demonstra a interface do criador do microformatohCard, disponível em Microformats.org (2012).

Figura 2. Criador hCard Fonte: Microformats.org (2012)

A seguir, o código gerado pelo criador hCard, a partir das informações fornecidas pelo usuário em sua interface:

Vanderlei Freitas Junior
Instituto Federal Catarinense
Rua das Rosas, S/N
Santa Rosa do Sul, SC, 88965-000 Brasil
4835348000

This hCard created with the hCard creator.

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 19

Vê-se, portanto, que o microformatohCard baseia-se no padrão vCard de publicação eletrônica de dados pessoais para implementar anotação semântica sobre estes dados na Internet. Diversas aplicações estão disponíveis para a geração de código hCard a partir de dados fornecidos pelo usuário. Outras também são capazes de identificar microformatos disponíveis em páginas da Web e fazer uso deles, como adicionar contatos em uma agenda.

5.2 Microformatos de eventos: hCalendar

O microformatohCalendar ocupa-se da anotação semântica de dados relativos a eventos e compromissos. Baseia-se no padrão de troca eletrônica de dados iCalendar e possui, como classe raiz a classe v Calendar evEvent, esta última representando um evento do tipo hCalendar. O microformato é composto pelas seguintes propriedades principais:

Quadro 2. Propriedades principais de hCalendar category Categoria class Classe description Descrição do evento dtend Data de fim do evento Dtstart Data de início do evento (obrigatória) duration Duração do evento geo Microformato Geo, paracoordenadas latitude Latitude longitude Longitude location Localização status Status do evento summary Resumo, título do evento (obrigatória) uid URL url Site do evento last-modified Últimamodificação rdate Aguardandoespecificação rrule Aguardandoespecificação attendee Atendente (permitido vCard) contact Contato (permitido vCard) organiser Organizador (permitido vCard) Fonte: Microformats.org (2012)

Alguns exemplos podem ser extraídos de Microformatos.org (2012):

http://oreillynet.com/pub/ Web 2.0 Conference: October 5-

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 20

7, at the Argent Hotel, San Francisco, CA

Para o microformatohCalendar, a comunidade Microformats.org também mantém criador automatizado, conforme demonstrado na figura 3.

Figura 3. Criador hCalendar Fonte: Microformats.org (2012)

O código abaixo fora gerado automaticamente a partir das informações fornecidas pelo usuário junto à interface do criador.

October 1th : 3rd, 2012 II CIKI at Madrid, Espanha

Intl. J. of Knowl. Eng., Florianópolis, v. 1, n. 1, p. 9 – 29 21 II Congresso Internacional de Conhecimento e Inovação

Tags: