Em artigo, especialista aborda aspectos técnicos da linguagem
A XML (eXtensible Markup Language – linguagem de marcação extensível) surgiu em 1996 e foi padronizada em 1998 pelo W3C (World Wide Web Consortium – www.w3c.org). Antes disto, nos anos 1970, a IBM havia lançado a linguagem GML (General Markup Language – linguagem de marcação genérica), com o propósito de classificar rapidamente uma grande quantidade de documentos organizacionais. Nos anos 1980, a ISO padronizou e foi criada a SGML (Standard Generalized Markup Language – Linguagem Padrão de Marcações Genéricas) – a GML padronizada. A história da XML definitivamente começou a ser escrita.
As limitações, então percebidas com o HTML (HyperText Markup Language), como o conteúdo das páginas se misturarem com as tags de apresentação e sistemas de informações, assim como a deficiência de compartilhamento de informações entre máquinas, dispositivos móveis e celulares, foram resolvidos.
A XML surgiu com o propósito inicial de estruturar dados de forma aberta, utilizando livremente as tags, possibilitando a troca de documentos eletrônicos. A XML é uma mistura explosiva. Está situada no centro da tríade: internet, banco de dados e processamento de documentos. Em pouco tempo, a XML atingiu o status central no mundo da TI nas empresas em que houvesse a necessidade de automatizar e promover a interoperabilidade utilizava-se a XML.
As principais possibilidades da XML são: trocar dados, melhorar a busca de informações, automatizar a web, dar suporte ao desenvolvimento de metadados e metainformações, prover infraestrutura única para diversas linguagens, automatizar os sistemas de gestão e suportar a web semântica.
Tal conceito, web semântica, é a aplicação de tecnologias avançadas do conhecimento para sistemas distribuídos em geral, com a finalidade de preencher o gap entre o ser humano e a máquina. Não se pode falar na web semântica sem citar o seu precursor, Tim Berners-Lee. No clássico artigo de 2001, The semantic web, Lee afirmou que a web semântica foi concebida como uma extensão da web atual, com o objetivo de desenvolver meios para que as máquinas possam servir aos humanos de maneira mais eficiente. Contudo, foi necessária a construção de instrumentos no intuito de fornecer sentido lógico e semântico aos computadores. Berners-Lee fez toda a proposição da arquitetura da web semântica baseada em XML.
Todas as tecnologias que circunda a XML, tais como DTD, XML Schema, XPath, XPointer, XInclude, XQuery, XSL e DOM surgiram como facilitadores, promovendo um padrão de integração na troca de documentos eletrônicos, de forma textual, simples, estruturada, extensível, flexível, semanticamente rica e com uma segurança adequada.
Cumpre destacar que o projeto da nota fiscal eletrônica (NFe – http://www.nfe.fazenda.gov.br/portal/) foi 100% proposto em cima das tecnologias da XML.
Por fim, a área de TI sentia-se desconfortável há alguns anos com a difícil tarefa de integração das aplicações, tecnologias e legados. A seriedade e compromisso do W3C fizeram com que o mundo usasse a XML. As fronteiras corporativas foram extrapoladas para a web, esta, por si só, não tem fronteiras. A partir deste cenário paradigmático, deparou-se com a necessidade de marcar semanticamente todo o conteúdo textual das páginas web, assunto para os próximos artigos.
* Fernando Hadad Zaidan é doutorando (disciplinas isoladas) na Escola de Ciência da Informação – UFMG (linha de estudos: gestão da informação e do conhecimento, gestão de conteúdo, web semântica, web 3.0, ferramentas wikis) e professor e coordenador da pós-graduação e graduação da Faculdade Pitágoras
**As opiniões dos artigos/colunistas aqui publicadas refletem unicamente a posição de seu autor, não caracterizando endosso, recomendação ou favorecimento por parte da IT Mídia ou quaisquer outros envolvidos nesta publicação