Ir para o conteúdo

Henrique Costa

Classificando decisões judiciais com inteligência artificial: primeira parte

Os profissionais do Direito consomem diversos tipos de informação jurídica, sendo duas as principais: a lei e a jurisprudência. A lei é uma norma abstrata, ou seja, não foi aplicada a um caso concreto. Já a jurisprudência é uma norma concreta, feita para solucionar um caso submetido ao Poder Judiciário.

Embora seja relativamente fácil conhecer as leis, pois elas estão publicadas em repositórios oficiais, é muito mais complexo conhecer a jurisprudência. O repositório legislativo mais utilizado é o do Planalto e ele ilustra bem como são organizadas e consumidas as várias formas de legislação federal no Brasil. Em contraste, existem diversos tribunais e cada um é responsável por publicar sua própria jurisprudência.

De uma forma geral, os tribunais tratam esses dados como documentos em linguagem natural, com uma camada adicional relativamente limitada de metadados.

Assim, existem poucos filtros para acessar essa informação, por exemplo: a data do julgado, o nome do julgador, o órgão ao qual pertence esse julgador, o nome e a posição de cada parte no processo, etc. Não encontramos, contudo, nenhum repositório público organizado em torno da dimensão do resultado do julgado, se favorável ou desfavorável seu desfecho.

Consideremos o seguinte caso de uso:

É possível imaginar que um advogado de um banco faça uma pesquisa de jurisprudência em determinado tribunal para avaliar a chance de êxito de uma nova demanda.

Tal como está indexada a base de julgados do STF, ele consegue, com alguma facilidade, encontrar casos concretos que trataram de um determinado tema. Contudo, o advogado tem muita dificuldade em encontrar, dentro desse tema, quais foram os casos vencidos por bancos e nos quais os mesmos bancos foram derrotados.

A utilidade de desenvolver uma solução que compreenda quais são os casos favoráveis e desfavoráveis está em viabilizar uma consulta agregada também por essa dimensão, referente ao resultado do julgado. Afinal, a consulta profissional tem quase sempre um lado interessado, de tal modo que saber qual o desfecho do caso é uma informação muito importante para a vida prática dos profissionais do Direito.

Nas próximas semanas, publicaremos por aqui a jornada de vários dos pesquisadores do DireitoTec, dedicados a mapear dezenas de milhares de julgados do STF. Isso permitirá criar uma base para treinamento de inteligência artificial, de tal modo que seja possível classificar automaticamente o desfecho de um acórdão. Que tal? Parece promissor?


Este post faz parte de uma série. Veja o post seguinte.

Construindo um laboratório de ciência de dados jurídicos

Para tratar de um assunto tão complicado, gostaria de iniciar por uma noção bastante simples: uma corrente é tão forte quanto seu elo mais frágil. Então, se você está em busca de construir (ou ingressar em) um laboratório de ciência de dados juridícos, dentro da sua universidade, é preciso investigar como está a força de cada uma das seguintes etapas:

  • Você tem pesquisas anteriores que já permitiram compreender o contexto jurídico de um campo delimitado? Em outras palavras, você já domina a área do negócio?
  • Sua pesquisa anterior se esgotou ou foi limitada pela ausência de dados? Ou seja, só é possivel alcançar um novo nível científico após desbravar esse horizonte?
  • Após confirmar as limitações do passo anterior, você formulou problemas cujas respostas podem ser obtidas a partir de dados?
  • Além dos problemas, você já formulou hipóteses passíveis de teste com esses dados?
  • É possível obter os dados demandados pela sua hipótese? Esses dados estão disponíveis ao menos de forma desestruturada?
  • Se necessário, você tem condições de estruturar esses dados?
  • Depois de estruturar os dados, você terá condições de manter a atualização e evoluir na modelagem dos dados? Em outras palavras, o quanto sua pesquisa é descartável?
  • Além de você, já existe uma equipe com cultura de dados que possa compreender os desafios desse tipo de pesquisa e está disposta a caminhar nessa direção?
  • Sua equipe tem uma rotina de trabalho e gestão do conhecimento que permitam tocar planos individuais relativamente simples em paralelo (por exemplo, alguns TCC), orientadas por marcos que amparem pesquisas mais sofisticadas no futuro (por exemplo, uma tese de doutorado)?
  • Você já documentou um ciclo de formação mínimo para embarcar novos pesquisadores? Existem alternativas mais econômicas a um ciclo de formação que dependa de você? Por exempo, já existe um curso de formação de ciência de dados de oferta regular e acessível aos potenciais membros da sua equipe?
  • Além de seus subordinados, você conta com pessoas com conhecimento de outras áreas que tenham condição de confirmar a viabilidade da sua ambição?
  • Ou seja, tendo como objetivo realizar pesquisas empíricas em direito (ciência social aplicada), você tem uma rede para evoluir em parceria com conhecimentos de suporte tecnológico (ciências exatas)?
  • Você está aberto a aceitar e orientar seu planejamento a partir dessa análise de viabilidade, conjugando projetos de pesquisa imediatamente viáveis e um horizonte de inovação a ser desbravado?
  • O resultado das pesquisas podem ser incorporadas a produtos que tenham valor para o mercado? Você já tem um plano para ter acesso ao mercado?

É claro que esse não é um caminho único. Existem diversos tipos de laboratório, principalmente quando se trata do contexto universitário, no qual boa parte dos recursos dos laboratórios são demandas de atividade de ensino ou de pesquisa básica. Mas, se você está envolvido na construção de um laboratório que tenha finalidade jurídica e que trabalhe com dados, talvez queira tomar certas cautelas. Afinal, tecnologia não e sua área principal.

Em conclusão, construir um laboratório não é o mesmo que comprar equipamentos. Um laboratório é construído em torno de problemas a serem solucionados. E esses não são problemas pequenos, pois exigem colaboração de diversas áreas para serem superados. O ambiente de trabalho e a cultura desse grupo de pessoas são os alicerces do laboratório. Na verdade, é algo bastante intangível.

Em um mundo no qual a infraestrutura tecnológica passou a ser consumida como serviço (computação em nuvem), ter os recursos físicos não é mais vantagem competitiva absoluta. O real desafio é desenvolver um trabalho que concilie pesquisa e inovação com a urgência e o pragmatismo demandados pelo mercado.

Afinal, nessa área, sem o mercado não há pesquisa financiada. E, sem dinheiro, não estarão presentes as demais condições para criar e manter um laboratório desse tipo. Minha recomendação é que não vá às compras no primeiro dia, pois antes você precisa responder à lista de perguntas listadas no inicio do post.


PS: Enquanto escrevia o post, tomei conhecimento que o CNJ, pela Portaria 25/19, criou um laboratório (chamado Inova PJe) e um Centro de Inteligência Artificial. Não acho que as reflexões do post seja plenamente aplicáveis a laboratórios institucionais. Na verdade, vejo mais o CNJ como uma instância decisória do que operacional. A operação propriamente dita ocorreria, por exemplo, em convênio com um laboratório acadêmico, cujo funcionamento descrevi no post.

Construindo um laboratório de ciência de dados jurídicos

Para tratar de um assunto tão complicado, gostaria de iniciar por uma noção bastante simples: uma corrente é tão forte quanto seu elo mais frágil. Então, se você está em busca de construir (ou ingressar em) um laboratório de ciência de dados juridícos, dentro da sua universidade, é preciso investigar como está a força de cada uma das seguintes etapas:

  • Você tem pesquisas anteriores que já permitiram compreender o contexto jurídico de um campo delimitado? Em outras palavras, você já domina a área do negócio?
  • Sua pesquisa anterior se esgotou ou foi limitada pela ausência de dados? Ou seja, só é possivel alcançar um novo nível científico após desbravar esse horizonte?
  • Após confirmar as limitações do passo anterior, você formulou problemas cujas respostas podem ser obtidas a partir de dados?
  • Além dos problemas, você já formulou hipóteses passíveis de teste com esses dados?
  • É possível obter os dados demandados pela sua hipótese? Esses dados estão disponíveis ao menos de forma desestruturada?
  • Se necessário, você tem condições de estruturar esses dados?
  • Depois de estruturar os dados, você terá condições de manter a atualização e evoluir na modelagem dos dados? Em outras palavras, o quanto sua pesquisa é descartável?
  • Além de você, já existe uma equipe com cultura de dados que possa compreender os desafios desse tipo de pesquisa e está disposta a caminhar nessa direção?
  • Sua equipe tem uma rotina de trabalho e gestão do conhecimento que permitam tocar planos individuais relativamente simples em paralelo (por exemplo, alguns TCC), orientadas por marcos que amparem pesquisas mais sofisticadas no futuro (por exemplo, uma tese de doutorado)?
  • Você já documentou um ciclo de formação mínimo para embarcar novos pesquisadores? Existem alternativas mais econômicas a um ciclo de formação que dependa de você? Por exempo, já existe um curso de formação de ciência de dados de oferta regular e acessível aos potenciais membros da sua equipe?
  • Além de seus subordinados, você conta com pessoas com conhecimento de outras áreas que tenham condição de confirmar a viabilidade da sua ambição?
  • Ou seja, tendo como objetivo realizar pesquisas empíricas em direito (ciência social aplicada), você tem uma rede para evoluir em parceria com conhecimentos de suporte tecnológico (ciências exatas)?
  • Você está aberto a aceitar e orientar seu planejamento a partir dessa análise de viabilidade, conjugando projetos de pesquisa imediatamente viáveis e um horizonte de inovação a ser desbravado?
  • O resultado das pesquisas podem ser incorporadas a produtos que tenham valor para o mercado? Você já tem um plano para ter acesso ao mercado?

É claro que esse não é um caminho único. Existem diversos tipos de laboratório, principalmente quando se trata do contexto universitário, no qual boa parte dos recursos dos laboratórios são demandas de atividade de ensino ou de pesquisa básica. Mas, se você está envolvido na construção de um laboratório que tenha finalidade jurídica e que trabalhe com dados, talvez queira tomar certas cautelas. Afinal, tecnologia não e sua área principal.

Em conclusão, construir um laboratório não é o mesmo que comprar equipamentos. Um laboratório é construído em torno de problemas a serem solucionados. E esses não são problemas pequenos, pois exigem colaboração de diversas áreas para serem superados. O ambiente de trabalho e a cultura desse grupo de pessoas são os alicerces do laboratório. Na verdade, é algo bastante intangível.

Em um mundo no qual a infraestrutura tecnológica passou a ser consumida como serviço (computação em nuvem), ter os recursos físicos não é mais vantagem competitiva absoluta. O real desafio é desenvolver um trabalho que concilie pesquisa e inovação com a urgência e o pragmatismo demandados pelo mercado.

Afinal, nessa área, sem o mercado não há pesquisa financiada. E, sem dinheiro, não estarão presentes as demais condições para criar e manter um laboratório desse tipo. Minha recomendação é que não vá às compras no primeiro dia, pois antes você precisa responder à lista de perguntas listadas no inicio do post.


PS: Enquanto escrevia o post, tomei conhecimento que o CNJ, pela Portaria 25/19, criou um laboratório (chamado Inova PJe) e um Centro de Inteligência Artificial. Não acho que as reflexões do post seja plenamente aplicáveis a laboratórios institucionais. Na verdade, vejo mais o CNJ como uma instância decisória do que operacional. A operação propriamente dita ocorreria, por exemplo, em convênio com um laboratório acadêmico, cujo funcionamento descrevi no post.

Para ser um orientador produtivo: banco de projetos e bliblioteca de referências

Já tentei todo tipo de organização para ser um orientador produtivo e, assim, ter um bom grupo de pesquisa. Não é uma tarefa fácil, mas - como professor - é algo que você precisa encarar de frente. Do contrário, será demandado repetidamente, sempre prestando as mesmas informações, a cada semestre que passa, para diferentes orientandos.

A organização com base em ferramentas é essencial na preparação dos encontros de orientação. Se isso for feito, o orientador passa a ter agilidade ao prover as fontes para que o orientando possa ler antes desse encontro pessoal. E o orientando terá um encontro mais produtivo, que é justamente aquilo que todos desejam. Assim é possível avançar na pesquisa com mais agilidade.

Banco de projetos

Na minha opinião, para a fase inicial da pesquisa, é essencial manter um banco de projetos que possa ser facilmente atualizado e compartilhado com os orientandos. Embora eu já tenha tentado, no passado, automatizar essa parte do fluxo de trabalho com uma base de dados  (incluindo um link de consulta e filtros abertos ao público),  não me parece mais uma boa ideia.

Hoje minha opção é por gerir pessoalmente o banco de projetos e apenas enviar para cada novo orientando um bloco de 10 a 20 projetos conexos ao tema de seu interesse. Depois de ler 20 projetos bons, é muito provável que o orientando retorne, para um segundo encontro, com um projeto da mesma qualidade.

Esta é minha primeira conclusão: para que o estudante possa redigir um bom projeto, ele precisa ler vários outros.

Sem ler dezenas de projetos, o estudante não interioriza aquilo que precisa. Ele fica sem referência, pois seu próprio projeto é praticamente o único que ele lerá na vida. O esforço nessa parte realmente tem retorno, não importando se você orienta um trabalho de graduação ou revisa um projeto de tese. Então, se você é professor, minha sugestão é que mantenha esse banco a partir da seleçao de todos os projetos que  venha a ler. Dá trabalho e toma tempo, mas o retorno é garantido.

Existem diversas opções para ajudar na manutenção desse banco. Você pode usar o Airtable para criar uma base de documentos e compartilhar o link com seu orientando. Se precisar de inspiração, veja este template. Embora o template seja de um catálogo de livros, basta adaptar para que se transforme em um catálogo de projetos. Se quiser alguma opção, veja o Zenkit, que é praticamente um clone do Airtable. Isso e tudo o que você precisa.

Biblioteca de referências

Chega a ser nostálgica a ideia de que alguém venha a desenvolver qualquer pesquisa apenas visitando a biblioteca para tirar cópia de livros de papel. Na verdade, todos nós iniciamos a pesquisa pela internet. Isso também nos leva a um problema comum, consistente no desafio de manter um acervo eletrônico de livros e artigos prontos para consulta e citação.

Se de um lado é certo que um estudante de graduação não precisa dessa sofisticação toda para terminar um trabalho de conclusão de curso, é muito provável que um pesquisador profissional tenha, qualquer que seja, a sua forma de organizar uma biblioteca digital.

Vamos avaliar alguns cenários. A pessoa tem uma pasta com cheia de arquivos em pdf no seu computador. Sem dúvida que funciona, apesar das limitações óbvias. Uma variação popular é a pasta compartilhada no Dropbox. Mas essas opções são apenas formas de armazenar arquivos. O que  um pesquisador profissional - e que seja moderninho - demanda está além disso. Afinal, é preciso gerir as citações de forma integrada com seu editor de texto ou, ao menos, gerar a bibliografia com um clique.

Acho que existem  opções bastante consistentes no mercado para esse tipo de tarefa. A mais popular (e que conta com um plano premium pago acessivel) é o Mendeley. No passado, acho que o EndNote já foi uma opção séria, mas é ainda mais caro. Eu prefiro a alternativa a open source, chamada Zotero. Para mim é a solução definitiva.

Esta é minha segunda conclusão: para que o orientações possa prover referências com agilidade, sua biblioteca de referências precisa estar organizada.

Conclusão

Para o orientador, vale investir na organização de uma base de projetos, pois isso poupa trabalho e aumenta a qualidade do projeto a ser elaborado pelo orientando. Uma vez que o projeto tenha sido elaborado, vale investir na organização de uma biblioteca de referências para auxiliar o aprimoramento do texto.

Em conjunto, essas ferramentas impedem que cada processo de orientação se converta na reinvenção da roda. E disso certamente não precisamos.


Para ser um orientador produtivo: banco de projetos e bliblioteca de referências

Já tentei todo tipo de organização para ser um orientador produtivo e, assim, ter um bom grupo de pesquisa. Não é uma tarefa fácil, mas - como professor - é algo que você precisa encarar de frente. Do contrário, será demandado repetidamente, sempre prestando as mesmas informações, a cada semestre que passa, para diferentes orientandos.

A organização com base em ferramentas é essencial na preparação dos encontros de orientação. Se isso for feito, o orientador passa a ter agilidade ao prover as fontes para que o orientando possa ler antes desse encontro pessoal. E o orientando terá um encontro mais produtivo, que é justamente aquilo que todos desejam. Assim é possível avançar na pesquisa com mais agilidade.

Banco de projetos

Na minha opinião, para a fase inicial da pesquisa, é essencial manter um banco de projetos que possa ser facilmente atualizado e compartilhado com os orientandos. Embora eu já tenha tentado, no passado, automatizar essa parte do fluxo de trabalho com uma base de dados  (incluindo um link de consulta e filtros abertos ao público),  não me parece mais uma boa ideia.

Hoje minha opção é por gerir pessoalmente o banco de projetos e apenas enviar para cada novo orientando um bloco de 10 a 20 projetos conexos ao tema de seu interesse. Depois de ler 20 projetos bons, é muito provável que o orientando retorne, para um segundo encontro, com um projeto da mesma qualidade.

Esta é minha primeira conclusão: para que o estudante possa redigir um bom projeto, ele precisa ler vários outros.

Sem ler dezenas de projetos, o estudante não interioriza aquilo que precisa. Ele fica sem referência, pois seu próprio projeto é praticamente o único que ele lerá na vida. O esforço nessa parte realmente tem retorno, não importando se você orienta um trabalho de graduação ou revisa um projeto de tese. Então, se você é professor, minha sugestão é que mantenha esse banco a partir da seleçao de todos os projetos que  venha a ler. Dá trabalho e toma tempo, mas o retorno é garantido.

Existem diversas opções para ajudar na manutenção desse banco. Você pode usar o Airtable para criar uma base de documentos e compartilhar o link com seu orientando. Se precisar de inspiração, veja este template. Embora o template seja de um catálogo de livros, basta adaptar para que se transforme em um catálogo de projetos. Se quiser alguma opção, veja o Zenkit, que é praticamente um clone do Airtable. Isso e tudo o que você precisa.

Biblioteca de referências

Chega a ser nostálgica a ideia de que alguém venha a desenvolver qualquer pesquisa apenas visitando a biblioteca para tirar cópia de livros de papel. Na verdade, todos nós iniciamos a pesquisa pela internet. Isso também nos leva a um problema comum, consistente no desafio de manter um acervo eletrônico de livros e artigos prontos para consulta e citação.

Se de um lado é certo que um estudante de graduação não precisa dessa sofisticação toda para terminar um trabalho de conclusão de curso, é muito provável que um pesquisador profissional tenha, qualquer que seja, a sua forma de organizar uma biblioteca digital.

Vamos avaliar alguns cenários. A pessoa tem uma pasta com cheia de arquivos em pdf no seu computador. Sem dúvida que funciona, apesar das limitações óbvias. Uma variação popular é a pasta compartilhada no Dropbox. Mas essas opções são apenas formas de armazenar arquivos. O que  um pesquisador profissional - e que seja moderninho - demanda está além disso. Afinal, é preciso gerir as citações de forma integrada com seu editor de texto ou, ao menos, gerar a bibliografia com um clique.

Acho que existem  opções bastante consistentes no mercado para esse tipo de tarefa. A mais popular (e que conta com um plano premium pago acessivel) é o Mendeley. No passado, acho que o EndNote já foi uma opção séria, mas é ainda mais caro. Eu prefiro a alternativa a open source, chamada Zotero. Para mim é a solução definitiva.

Esta é minha segunda conclusão: para que o orientações possa prover referências com agilidade, sua biblioteca de referências precisa estar organizada.

Conclusão

Para o orientador, vale investir na organização de uma base de projetos, pois isso poupa trabalho e aumenta a qualidade do projeto a ser elaborado pelo orientando. Uma vez que o projeto tenha sido elaborado, vale investir na organização de uma biblioteca de referências para auxiliar o aprimoramento do texto.

Em conjunto, essas ferramentas impedem que cada processo de orientação se converta na reinvenção da roda. E disso certamente não precisamos.


Compartilhando o status do seu trabalho: integração do Jibble com o Slack

Trabalhar já é difícil. Imagine prestar contas... e trabalhar. Mas é uma rotina na qual precisamos investir para que nosso trabalho seja, ao menos, mais visto pelos colegas. E isso também é importante para a melhora do trabalho de equipe. Neste post dou algumas dicas sobre como é possível organizar essa rotina com algumas ferramentas de produtividade.

Usando o Slack como área de trabalho remoto

O vídeo a seguir mostra uma rotina simplificada de como prestar contas. Capturei o telefone com o Jibble à esquerda e a respectiva equipe no Slack. Basicamente, o que o vídeo mostra é um usuário (no caso eu 🙂) navegando dentro do aplicativo do Jibble no iPhone e selecionando: In/Out → In → Confirm In.

Como é intuitivo, para que a integração funcione, o administrador precisa ter criado as contas tanto no Jibble quanto no Slack. Depois o administrador precisa convidar a equipe, por email, para fazer parte em cada um dos sistemas. Por fim, integrará os serviços, convidando o bot do Jibble para habitar a área de trabalho do Slack. Mas realmente isso só interessa ao administrador.

Do ponto de vista do usuário, ele somente receberá os convites, cadastrará suas senhas e, se desejar, também vai instalar os aplicativos nas plataformas de sua preferência. Aqui estamos demonstrando o Jibble no telefone e o Slack no computador e a rotina capturada é a que vai regitrar meu check-in.

Como a equipe do Jibble está integrada por meio do Slack, todos serão notificados, no respectivo canal, de que estou trabalhando no momento. Veja a notificação que surge no canto inferior direito da tela, ao final da linha do tempo do canal. Ao terminar, tudo o que preciso fazer é: In/Out → Out → Confirm Out.


Além do controle de ponto: o que foi efetivamente feito

Essa simples interação vai gerar informação suficiente para saber quem trabalhou, por quanto tempo e em qual frequência. Mas o sistema permite saber muito mais sobre o trabalho. Veja, por exemplo, outra equipe que tenho no Jibble, ligado a outro espaço de trabalho no Slack. Essa outra equipe já tem uma cultura estabelecida de prestação de contas com mais detalhes.

Lá foi habilitado um campo chamado "Optional Note/Task", no qual usuário informa o que pretende fazer ao iniciar seu turno de trabalho. Igualmente, ao fazer o seu check-out, o mesmo campo vai aparecer e o usuário terá a chance comentar se cumpriu ou não o que pretendia fazer.

Para usuários experientes, basta informar o que conseguiu realizar ao fazer ao check-out, sendo o primeiro registro dispensável. De outro lado, a experiência mostra que usuários menos aplicados simplesmente podem não se lembrar de fazer o check-out, deixando uma lacuna no sistema. Por isso é importante se acostumar a lançar também o que você pretende fazer ao iniciar o turno de trabalho.


Não é tema deste post, mas o Jibble tem uma série de configurações adicionais e que esperamos que usuário descubra ao usar o aplicativo. A primeira funcionalidade que o usuário notará é que sempre programo um check-out automático a cada quatro horas. O efeito prático é que o usuário "esquecido" ficará sempre marcado pelo "auto check-out" e não terá a oportunidade de registrar o que conseguiu realizar. Naturalmente, esse é um ponto negativo e que ficará registrado para futura avaliação. 😇

PS: Gostou? Quer saber mais? Veja o Help do Jibble sobre como fazer check-in sem ter que instalar o aplicativo.