Tim Berners Lee propôs, em 1994, em uma conferência no CERN (European Organization for Nuclear Research), em Genebra, uma evolução da Web. Com desenhos não muito bonitos, mas em linguagem muito clara, o criador da Web defendeu em sua apresentação que a Web deixasse de ser só um índice de nodes linkados para ser um reservatório de significados. Algo que pudesse trazer para a Internet a complexidade e a beleza das relações entre humanos e máquinas. Assim, o conceito de Web dos Dados, uma rede de significados que se correlacionam, apareceu pela primeira vez. Para dar significado às coisas na Web é preciso ensinar às máquinas como ler estes significados. Já sabemos que o browser lê o que está escrito em linguagem humana por causa da mais famosa linguagem de marcação do mundo: o HTML. É ele quem diz para o browser o que o browser está apresentando e o que você está colocando na Internet através dele. Entretanto, o HTML não conseguia definir o significado e a relação entre os recursos. O W3C criou um domínio, ou uma força tarefa, para desenvolver tecnologias da Web Semântica: o W3C Semantic Web Activity.Desse grupo surgiram melhorias e padrões para evoluir a Web dos Dados de maneira concisa e também vários exemplos da Web Semântica aplicada. Em 2013, o grupo foi fechado e substituído pelo Data Activity, destinado a construir a Web dos Dados.
As principais funções da Web Semântica, conectar, descrever e entregar dados, foram cobertas por tecnologias simples: conectar com URIs (identificadores), representar ou descrever dados com modelos RDF e o SPARQL para extrair dos bancos de dados relacionais as respostas às perguntas que se quer responder quando construímos aplicações semânticas.
O modelo de descrição de recursos na Web, ou RDF, funciona descrevendo para as máquinas as relações e desambiguando os significados de cada node. Assim se formam as triplas, que são pequenas “frases” que os computadores conseguem entender e representar a partir dos recursos que colocamos na Web. Esses recursos, conectados pelos significados, vão formando gradualmente uma grande nuvem de recursos conectados, como na figura abaixo:
No começo, os esforços se centraram no desenvolvimento de vocabulários, necessários para desenvolver as tags que os computadores entendem. A iniciativa do Linked Data Vocabularies, ou Vocabulários para Linked Data, foi muito importante nesse contexto porque ofereceu um ecossistema que cresce organicamente oferecendo uma grande variedade de vocabulários para descrever recursos. Esses vocabulários, quando em conjunto, formam as ontologias, que são conjuntos destinados a oferecer significados concisos para assuntos específicos. A existência de ontologias garante a interoperabilidade entre bancos de dados semânticos. Se interoperabilidade existe, é possível cruzar dados e experimentar trocas entre streamings de dados dinâmicos com menos esforços e recursos. A evolução desses calendários resultou na força tarefa liderada pelo Google que reuniu um monte de buscadores, entre eles o Bing, Google, Yahoo! e o Yandex para criar um esquema com “microdata” (não confundir com metadados!). Aqui tem um artigo bem bacana sobre o assunto para serem inseridos no markup, buscando melhorar os resultados de busca e fazendo com que os usuários tenham mais facilidade em encontrar o que querem na Web.
A Web Semântica também é chamada de Web de Dados conectados porque se apoia em uma miríade de recursos e tecnologias em desenvolvimento para retirar valor desses dados. Muitos grupos se esforçam para trazer essa realidade para a Web, seja com recomendações de como usar, seja abrindo o código de suas aplicações, seja se reunindo para desenvolver padrões novos que possam beneficiar os desenvolvedores com simplicidade e tecnologias maduras. Nesse sentido, as iniciativas de uso experimental dessas tecnologias são muito bem-vindas. Por exemplo, recentemente o JSON-LD foi lançado para ajudar desenvolvedores a conectar dados e dar significado à eles. Que tal testar?
O W3C Brasil lidera hoje, junto com a IBM e o governo britânico, o Working Group de Melhores Práticas para colocar Dados na Web, carinhosamente apelidado pelo acrônimo de #dwbp. Para se juntar às reuniões do grupo você precisa ser filiado ao W3C, mas para participar das discussões assíncronas pela lista de e-mails, basta mandar uma mensagem para public-dwbp-wg@w3.org com suas opiniões sobre o andamento das discussões do grupo.
Para saber mais, navegue pelos links abaixo e boa sorte!
- RDF
- RDF Best Practices
- RDFa
- RDF Relationship to Other Formats
- GRDDL
- POWDER
- Semantic Annotation for WSDL and XML Schema
- Provenance
- RDB2RDF
- Linked Data
—–
Artigo publicado no iMasters.