Como passo inicial na pesquisa, foi estudado como os documentos são hoje publicados na web. O orgão que regulamenta muitos dos padrões de publicação hoje presentes, inclusive o famoso HTML é o W3C[2]. Nesta fase indentificou-se que a demarcação feita com o uso do HTML enfatiza a estrutura e apresentação do documento ao se utilizar um renderizador apropriado (um browser por exemplo), ao invés de destacar a semântica de cada parte. Segue abaixo um exemplo de código fonte HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 3.2//EN">
<html>
<head>
<meta name="generator" content="HTML Tidy, see www.w3.org">
<meta name="author" content="Fabio Braga de Oliveira">
<meta name="title" content="Catalogo de Produtos">
<title>Catalogo de Produtos</title>
</head>
<body>
<h1>Catalogo de Produtos</h1>
<table border="1" width="100%">
<tr>
<td width="70%"><b>Nome do produto</b></td>
<td><b>Preco</b></td>
</tr>
<tr>
<td>Arvore Rubro-Negra</td>
<td>20,00</td>
</tr>
<tr>
<td>Arvore Binaria</td>
<td>5,00</td>
</tr>
<tr>
<td>Arvore B</td>
<td>25,00</td>
</tr>
<tr>
<td>Grafo</td>
<td>15,00</td>
</tr>
<tr>
<td>Grafo Dirigido</td>
<td>20,00</td>
</tr>
</table>
</body>
</html>
O código HTML anterior gera a visualização da figura 1 num browser.
Como pode-se notar, os rótulos no HTML auxiliam no posicionamento do texto.
Mas não determinam o significado do seu conteúdo, como pode ser visto no uso repetido do rótulo <td></td>. Na especificação da W3C existe apenas um rótulo com função de descrição de atributos do documento, os rótulos <meta...>, conhecidos como rótulos meta-tags. Estes representam dados simples sobre o documento, como qual o autor, qual aplicativo gerou o documento, o título. Mas não existe uma convenção para seu uso, ou mesmo obrigatoriedade, sendo hoje quase que completamente ignorados.
Fabio Braga de Oliveira 2004-12-09