Integrando GED aos demais sistemas da empresa
Maurício Antônio Ferreira
Dentre as inúmeras aplicações de GED no contexto das empresas, podemos definir dois grandes grupos: o das aplicações centradas no GED e o grupo no qual o GED se integra aos ambientes legados da empresa. O nosso foco nesse artigo será para o segundo grupo.
A tecnologia de Document Imaging é a mais utilizada nestes tipos de aplicações, daí vem o nome Imaging Enabled, que significa habilitar imagem em uma aplicação de legado. Esse mesmo conceito não é válido somente para imagem, isso é: essa integração pode ser feita com qualquer tipo de conteúdo armazenado no repositório, como por exemplo arquivos do Word e Excel. Surge então um novo conceito que é o Content Enabled.
As grandes aplicações de integração estão no ambiente administrativo e dentre elas a integração da imagem das notas fiscais ao sistema de ERP já existente.
Para entendermos um pouco mais dessa integração, vamos rever o ciclo de vida de uma nota fiscal no modo tradicional e na seqüência com Imaging Enabled.
As notas fiscais dão entrada nas empresas juntamente com o produto. Na inspeção de recebimento, checa-se a nota fiscal contra o pedido de compra e se o produto que está sendo entregue corresponde à nota fiscal. Em muitas empresas, faz-se uma cópia da nota fiscal e arquiva-se para controle. Nota fiscal e produto são então enviados para o cliente interno que fez o pedido. O cliente interno verifica se o produto é realmente o que foi solicitado, aprova a nota fiscal, faz uma cópia para efeito de garantia e encaminha a nota fiscal para o departamento de Contas a Pagar. Lá, é definido um processo de pagamento, que contém entre outros documentos uma cópia da nota fiscal. A nota é então enviada para o departamento fiscal, que fará os lançamentos nos livros fiscais. Normalmente esse também faz uma cópia da nota e a encaminha para o departamento de Contabilidade, que fará o lançamento contábil, o arquivamento físico da nota fiscal e controlará sua guarda pelo tempo necessário, devido às exigências fiscais.
Nesse nosso exemplo, tivemos quatro cópias da nota, mais a original, temos cinco objetos contendo a mesma informação. O problema não para aí, pois as cinco cópias serão guardadas e ocuparão espaço nos arquivos em papel, quintuplicando as reais necessidades de guarda de documentos.
Com Imaging Enabled, a nota fiscal é digitalizada na inspeção de recebimento; o original em papel é colocado em uma caixa de arquivo ordenada por data e a imagem indexada é referenciada no sistema legado. O fluxo de aprovação do sistema de ERP é ativado e o cliente interno recebe uma notificação para aprovação, juntamente com um link para visualização da imagem da nota fiscal. Contas a Pagar é notificado na seqüência e pode visualizar a imagem da nota fiscal assim como a área fiscal e a contabilidade. Todos passam a ter a imagem habilitada nos seus sistemas legados.
Essa tecnologia está disponível em praticamente todos os sistemas de ERP e para muitas empresas tem sido a primeira experiência de GED.
Todos os conteúdos são mantidos nos repositórios dos produtos de GED. A integração de imagem ou de outros conteúdos é habilitada nos sistemas legados através de APIs (ambientes para desenvolvimento das interfaces) fornecidos juntamente com os produtos de GED. Em alguns produtos de GED essa característica de integração já está disponível de forma nativa, não exigindo programação. Integrações via OLE, DDE, ODMA e WebDAV são alguns dos métodos de integração disponíveis.
Qualquer sistema legado pode ser utilizado como interface para um repositório de conteúdos não-estruturados. Os hospitais também têm utilizado esse tipo de tecnologia. Nesse caso, os prontuários dos pacientes digitalizados podem ser consultados através do sistema de controle de pacientes já em uso no hospital. Um case que utilizei no nosso seminário de GED em vídeo é o do Hospital Albert Einstein, que através do seu sistema legado permite a consulta aos prontuários dos pacientes.
A tecnologia de Workflow também pode ser utilizada para integração com os demais sistemas da empresa. A grande utilização nesses casos é de automatização de processos através da integração entre diferentes sistemas legados controlados por uma aplicação de Workflow.
Para um melhor entendimento vamos imaginar um processo de compras, onde a empresa já disponibiliza uma interface web para compras em seu site. O sistema de estoque está em Cobol. O sistema de Contas a Receber, Faturamento e Contabilidade são módulos adquiridos de um dos produtos de ERP do mercado e para complicar mais um pouco tem-se o sistema de estoque em plataforma de mainframe; o sistema financeiro em Unix e o ambiente web em Windows.
Através de Workflow pode se desenhar o fluxo do processo e todas as interações com os sistemas legados. Os usuários trabalham em interfaces baseada em browser na web sem ter nenhum contato com os sistemas legados. Esse tem sido o foco das aplicações de BPM/Workflow.
Árvores e ilhas do conhecimento: taxonomias x ontologias
Renate Landshoff - Consultora em gestão documental e gestão do conhecimento
Plena Consultores – www.plenaconsultores.com.br - renate.landshoff@plenaconsultores.com.br Com o surgimento das intranets e portais corporativos, o conteúdo disponibilizado em uma organização passou a ser descentralizado e cada área passou a publicar as suas notícias, seus documentos e suas informações, sem padrão documental, sem metadados padronizados para possibilitar a busca desse documento e sem uma estrutura única de navegação para que esses documentos e informações pudessem ser localizados. Eis onde entra a taxonomia.
Para entender o que é taxonomia de uma forma simples, remeto os leitores para as nossas aulas de biologia onde aprendemos a classificação dos seres vivos. A taxonomia representa os conceitos através de uma estrutura hierárquica de termos, podendo organizar seu conteúdo de forma cronológica, alfabética, espacial, funcional, relacional e assim por diante. Tentamos fazer isso em nosso diretório pessoal, criando caixinhas de assuntos que utilizamos para classificar os documentos gerados.
Agora, pense nessa dinâmica, em um ambiente corporativo, onde cada área utiliza uma linguagem própria e a quantidade de documentos e informação desestruturados é enorme.
As organizações têm observado um baixo grau de precisão na recuperação de informação e documentos. É comum a frase: “sabemos que temos, mas não conseguimos localizar”. Ao procurar por um documento o usuário vê-se obrigado a percorrer uma estrutura corporativa que pode não ser a lógica que ele se utilizaria para recuperar aquele documento.
As taxonomias estão sendo consideradas a “bola da vez” em projetos corporativos que envolvam implantação de intranets e portais, pois oferecem uma estrutura lógica de navegação e busca.
Praça da árvore... do conhecimento
Da mesma forma que os seres vivos tiveram sua estrutura representada em categorias, as organizações estão sentindo a necessidade de representar sua estrutura e permitir a navegação por suas diversas categorias, sem ter de adivinhar o que digitar no campo “busca”, verdadeira “caixas-preta”, desafiando o nosso conhecimento e exigindo inúmeras tentativas e erros até chegarmos na informação desejada.
As pessoas não se encontram mais nas praças de suas cidades, se encontram, em função de seu interesse, nas árvores de conhecimento criadas pela rede das redes, a Internet, e precisam de um mapa do conhecimento para chegar nessa árvore. Essa árvore é uma espécie de mapa do site mais sofisticado, em forma hierárquica, de acordo com a lógica presumida a partir das relações entre as entidades.
Na construção de taxonomias, a relação a ser estabelecida dependerá do universo a ser estruturado. Podemos ter uma organização cronológica, alfabética, espacial, funcional, relacional e assim por diante. E podemos também contar com a ajuda de um vocabulário controlado, para identificar a relação entre os termos e os sinônimos, por exemplo. Outros aspectos que deverão ser considerados: a cultura da empresa, os processos organizacionais, a tipologia dos documentos, os metadados e a linguagem utilizada por cada setor envolvido.
Foco na gestão documental Para complicar a busca, a gestão documental passou a ser uma área cinzenta nas organizações. Não existe um setor de produção e disseminação de documentos. Todo e qualquer funcionário produz e publica, desde um simples formulário até um documento complexo sobre um projeto, um contrato, uma planilha e assim por diante. Como inserir esses documentos em um ambiente corporativo e recuperá-los de forma eficiente? Claro que os metadados são pontos de acesso essenciais, mas uma taxonomia passou a ser estratégica.
Um outro fenômeno que está surgindo e que já está sendo utilizado no âmbito corporativo, é a construção de folksonomias , ou seja, uma taxonomia criada com a colaboração do usuário. Por exemplo, se acho um site interessante sobre taxonomia, posso adicionar o link a essa comunidade já existente , posso fazer comentários ou posso saber quem mais achou determinado site interessante também. Ah, e você pode manter os seus bookmarks favoritos na web, criando a sua própria taxonomia para poder acessá-lo a qualquer momento.
Indo além, as ontologias estão ganhando terreno nas discussões e aplicações no universo da recuperação da informação, pois permitem a construção de uma estrutura com seus significados e conceitos identificados através da linguagem de máquina no contexto da web semântica. Uma rede semântica é uma rede que serve para interligar significados de palavras e permitir a interoperabilidade e cooperação entre estruturas afins. As ontologias estão sendo chamadas de “ilhas de conhecimento”, pois o conceito nos remete para a idéia de ilha, onde conseguimos isolar apenas o conteúdo relevante e verdadeiramente significativo para o nosso universo a ser pesquisado.
Essa é uma área de fronteira, emergente, e promete grandes mudanças na forma de recuperarmos informação na web e em nossas organizações.
Critérios e cuidados na captação de documentos
Maurício Antônio Ferreira
Converter documentos do mundo papel para o digital não é simplesmente comprar um escaner, um software de GED e sair digitalizando, como muita gente pensa e, infelizmente, vem fazendo. Antes de digitalizar, é necessário organizar e definir o que realmente vai ser convertido em imagem digital, como será recuperado e por quanto tempo precisará ser mantido digitalmente.
O risco aqui é simplesmente transferir a desorganização para um método mais eficiente de localização, que nada mais fará do que ampliar os problemas.
O processo de captação pode ser terceirizado para o volume de documentos do legado e deve ser dimensionado no mínimo para o volume diário de documentos que entram na empresa.
Com a documentação organizada, deve-se prepará-la para a digitalização. Preparar significa tirar das pastas, tirar clipes e grampos, colar documentos rasgados etc.
Os documentos,, normalmente são organizados em lotes que variam em quantidade de acordo com o processo. Só como referência, na Prodam os lotes são de 50 multas. Em algumas aplicações de Recursos Humanos têm-se lotes de 300 páginas, e assim por diante. O próximo passo é a digitalização dos lotes.
Digitalização de documentos é um processo que requer um bom controle de qualidade. Não economize em tecnologia nessa fase, pois isso reduzirá a necessidade de retrabalho principalmente no processo de redigitalização. Provavelmente, um documento mal digitalizado não poderá ser consultado, pois o documento pode ficar ilegível.
Durante os meus treinamentos - e mesmo em algumas consultorias - é comum encontrar acervos mal convertidos e é inevitável a pergunta: “Podemos aplicar tecnologia para melhorar a qualidade das imagens já digitalizadas?” É uma resposta difícil, pois na maioria dos casos não se tem mais o que fazer, não existe mágica. O problema fica maior quando os originais foram guardados de forma desorganizada ou, em alguns, casos destruídos.
Ainda dentro do processo de digitalização, outro cuidado é com o mau dimensionamento do escaner ou software de captação. Já me deparei com processos impraticáveis, seja porque o escaner adquirido é muito lento, ou porque o software utilizado não apresenta recursos que permitem uma produção condizente com o volume a ser digitalizado.
Com o documento já convertido para imagem, precisamos agora indexá-lo, isso é: incluir as chaves que serão utilizadas para recuperação do mesmo no processo de consulta. O cuidado aqui é com o número de índices. Se colocarmos muitos índices, teremos uma carga de trabalho muito grande nesse processo, gerando um custo alto. Se colocarmos poucos índices, vamos gerar um problema para o processo de consulta, pois a recuperação poderá ficar muito lenta. Para exemplificar, imagine o prontuário dos funcionários na área de Recursos Humanos. Se indexarmos o prontuário pelo código ou nome do funcionário, na consulta será necessário a navegação por todos os documentos do prontuário até encontrar o que se procura. A outra possibilidade seria indexar o prontuário pelos tipos de documentos além do código ou nome do funcionário, de tal modo que na consulta não seja necessário navegar por todo o prontuário, mas somente pelo conjunto de documentos que se procura. Nesse segundo caso, geramos mais trabalho no processo de indexação, mas reduzimos o tempo de recuperação. O melhor índice é aquele que consiga dar unicidade no documento com a menor quantidade de chaves, e deve ser bem definido para cada tipo de aplicação.
O grande risco de um mau processo de indexação é perder a referência para a localização do documento ou se ter um processo tão lento, como a tradicional busca de agulha no palheiro.
O processo de indexação também pode ser automatizado. A técnica mais utilizada é a leitura do código de barras por software a partir da imagem, que gera o índice e já faz a referência da imagem, sem a necessidade de intervenção humana.
OCR, leitura automática de caracteres padronizados, e ICR, leitura automática de caracteres manuscritos, vem cada dia mais melhorando seus níveis de reconhecimento e juntamente com outras técnicas como checagem em tabelas de bancos de dados e checagem de dígitos de verificação, vêm permitindo sua utilização no processo automático de indexação.
Quando não se tem como automatizar a indexação, se utiliza digitação a partir da imagem, podendo-se em alguns casos aplicar dupla digitação.
A captação de documentos deve ser tratada como um subsistema e após a indexação e sua verificação, faz-se a liberação das imagens e índices para o software de GED que cuidará do armazenamento e recuperação das imagens.
PDF/A: o padrão ISO para arquivos de longa durabilidade
Luiz Augusto Bellucci Cavalcante - Diretor da PDF Brasil Documentação Eletrônica Ltda. - luiz.augusto@pdfbrasil.com.br
A história da evolução dos formatos de documentos digitais teve um episódio muito importante no último dia 13 de setembro: foi publicada a Norma ISO 19.005-1, que especifica o formato PDF como padrão universal para arquivamento de documento digital de longa duração. Esse PDF é chamado de PDF/Arquive, ou simplesmente, PDF/A.
O grande incentivador dessa normatização foi o governo dos Estados Unidos, principalmente o judiciário e as agências reguladoras, que recebem diariamente uma enorme quantidade de páginas de documentos digitais em PDF e precisam garantir que esses documentos possam ser lidos, pesquisados e impressos daqui a 40, 50 anos ou mais.
Foram três anos de trabalho de um comitê formado por mais de 300 pessoas para a conclusão da Norma. Entre essas pessoas estavam profissionais de governos, da indústria de tecnologia documental e de associações como a AIIM.
Baseada na versão 1.4 do PDF da Adobe Systems, a Norma nos diz o que pode e o que não pode estar em um PDF para que esse esteja no padrão, eliminando dos documentos códigos de programação, elementos externos, fontes não desejadas etc.
Com o PDF/A, bibliotecas, centros de documentação, arquivos e outras entidades poderão intercambiar seus conteúdos digitais com muita facilidade, pois o formato possui uma série de recursos que facilita essa tarefa. Dentre tais recursos estão o suporte interno a metadados em XML, imagens supercomprimidas ( até 20% do TIFF CCITT G4, na mesma resolução), imagens pesquisáveis pelo conteúdo e links de hipertexto.
Com a publicação dessa Norma, a expectativa é que o PDF/A, em pouco tempo, se torne obrigatório em projetos onde a durabilidade dos documentos é fundamental, substituindo definitivamente formatos proprietários, PDFs não padronizados e o próprio TIFF CCITT G4, que se tornou obsoleto em aspectos de compressão e de suporte à web.
“Comunhão de escopo” e mercado de imagens digitais
Gilberto Martins de Almeida ( gmalmeida@all.com.br ) - Advogado, e Professor de Direito da Informática
Embora seja fato desconhecido da maioria da população, na segunda metade do século XX aconteceu uma transformação significativa do Direito, que pode ser extremamente útil na virada do milênio.
Trata-se de mudança de filosofia, que se baseava em nítidas demarcações de territórios e constantes embates entre partes antagônicas, e que agora se caracteriza por diluição de fronteiras e por espírito de cooperação. Até recentemente, a vantagem de um implicava na desvantagem do outro. A propósito, se dizia: “dura lex, sed lex”, e “o contrato é lei entre as partes”. Agora, se diz: a lei deve ser interpretada de acordo com sua função social, e a boa-fé das partes vale tanto ou mais que as cláusulas escritas no contrato. Mas, o que isso tem a ver com imagens digitais?
Em primeiro lugar, isso importa na relativização da divisão entre Direito Público e Direito Privado, que dificultava a composição de interesses entre governo e particulares. Assim, entre quem (Estado) tem originalmente a fé pública e quem (Cartórios) a recebe por delegação, deixa necessariamente de haver contraposição de interesses e se torna possível uma sinergia prática e jurídica. O mesmo se aplica a fornecedores de equipamentos ou serviços de gestão eletrônica de documentos (ou, gestão de documentos eletrônicos).
Essa cooperação, em que a vantagem de um é a vantagem também do outro, é o que está por trás do conceito de comunhão de escopo. Ela pode ser instrumental para uma reconfiguração da participação no mercado de imagens digitais, em que o Estado exerça sua função regulatória, e os particulares se dividam entre os certificadores, os registradores, e os prestadores de serviços ou fornecedores de equipamentos.
O que se passa hoje no campo da assinatura digital (onde por ora se assiste a notórias polêmicas e disputas entre os atores do mercado) é o que fatalmente se estenderá amanhã ao terreno das imagens digitais, com a possibilidade, entretanto, de que neste último se construa desde mais cedo a harmonização que, em última instância, é pretendida por todos.
Para tanto, uma última observação e uma advertência decorrente: enquanto a concepção vigente era a da separação e conflito, era natural que os debates se resumissem a questões basicamente econômicas e mercadológicas e, portanto, os conceitos jurídicos fossem relegados a segundo plano, mas agora que se torna imperativa a articulação de “arranjos produtivos”, os conceitos jurídicos devem ocupar posição de destaque.
Nesse sentido, devem ser revisitadas algumas noções arraigadas naquele período, que limitam – irrazoavelmente para as novas necessidades, que marcam o cenário atual - conceitos fundamentais, tais como o de “original”, o de “conteúdo”, e o de “fé pública”.
Uma vez revolvidas e atualizadas tais noções, se poderá marchar para a aceitação (em sendo adotados certos mecanismos e formalidades) da conversão de informações (independente do tipo de mídia em que inicialmente disponíveis) em imagens originais eletrônicas (superando a noção de que, por exemplo, a “digitalização” esteja fadada a ser sempre apenas uma cópia), com força probante legalmente reconhecida e vinculante.
Esse tipo de possibilidade, a ser devidamente trabalhada e construída, é essencial para a tarefa de compatibilizar interesses, assegurando papel e proveito para todos no mercado das imagens digitais.
|