Desde a abertura do escritório em Lisboa, em 2015, a DefinedCrowd já teve de mudar de instalações pelo menos quatro vezes. O crescimento rápido da equipa, que já ultrapassa as 100 pessoas, deve-se à diferenciação do produto que oferece, diz ao Dinheiro Vivo Catarina Peyroteo Salteiro, diretora global de comunicação e relações públicas da empresa.
“Recolhemos, estruturamos e enriquecemos os dados para as empresas que estão a criar os seus próprios modelos de inteligência artificial e machine learning”, sintetiza a responsável. “Ou seja, uma empresa que esteja a desenvolver a próxima Siri ou Alexa precisa de dados para treinar o modelo que irá dar o propósito ao serviço que irá prestar. Nós damos esses dados.”
A DefinedCrowd foi fundada por Daniela Braga em 2015, com sede em Seattle, onde a empreendedora portuguesa se encontrava a trabalhar. A ideia provou ser visionária e captar o interesse de grandes empresas, navegando a necessidade de muitos dados na explosão de serviços de inteligência artificial.
Boa parte dos clientes da startup pode ser encontrada na lista Fortune 500. Mastercard, BMW, Randstad, Yahoo Japão e Softbank são alguns dos nomes que trabalham com a DefinedCrowd, num total de 40. Em Portugal, a startup trabalha com a EDP e com a José de Mello Saúde.
Segundo a responsável, o grande problema que existe neste momento com os dados que são usados para treinar sistemas de inteligência artificial é a morosidade do processo e a sua qualidade. “Além de se estimar que 80% do tempo dos cientistas de dados é passado a limpar os dados e a estruturá-los, o que é uma tarefa bastante tediosa, nas outras companhias que oferecem este tipo de solução ou os dados têm má qualidade ou o fazem a uma velocidade muito lenta ou não têm escala”, indica a responsável. “Nós garantimos estas três coisas.”
O tipo de dados em causa pode ser muito variado e ser fornecido pela empresa cliente – por exemplo, horas de áudio gravadas no seu call center para serem trabalhadas. Outra hipótese é ser a DefinedCrowd a fornecer os dados de treino: “se uma companhia quer um sistema de deteção de animais, nós podemos recolher essas imagens”, explica Catarina Salteiro.
A qualidade dos dados é contratualizada nos acordos de nível de serviço para ser sempre entre 95% a 98% e a entrega dos mesmos é “cinco a dez vezes mais rápida” que os concorrentes, detalha Catarina Salteiro. A escala global é conseguida através do modelo misto que a startup usa e lhe permite cobrir 70 línguas e dialetos.
Este modelo mistura os algoritmos desenvolvidos pelos engenheiros da empresa com uma comunidade de pessoas espalhadas pelo mundo que fazem “micro-tarefas” associadas. A diretora explica: “temos a nossa componente in-house de machine learning, que ajuda a que o processo seja eficiente e garanta qualidade, e temos a nossa comunidade, que é a componente humana dos dados.” A Neevo by DefinedCrowd é a plataforma da comunidade, onde as pessoas se inscrevem para fazerem tarefas permitindo à startup dar uma grande cobertura de línguas. “Temos mais de 100 mil pessoas em todo o mundo inscritas na nossa plataforma, que fazem as tarefas e são remuneradas por isso”, explica Salteiro. “Acaba por ser um processo de crowdsourcing, apesar de nós não adorarmos essa palavra.”
Dentro da plataforma, são colocados mecanismos para garantir que o trabalho que está a ser feito pelos humanos é preciso e tem qualidade. “As pessoas passam por testes para poderem participar em certas tarefas e temos simultaneamente os algoritmos de machine learning também a trabalhar.” O objetivo é automatizar tudo que seja possível, “porque as máquinas enganam-se menos do que os humanos, a verdade é essa.”
Para evitar os preconceitos que têm sido descobertos em algoritmos e sistemas de inteligência artificial, a startup aplica estratégias de distribuição de modo a diversificar a poll de trabalho com os dados. “Por exemplo, se o cliente não especificar, tentamos evitar preconceitos de género tendo 50% homens e 50% mulheres”, adianta a responsável.
Apesar de ter a maioria da equipa baseada em Portugal, os mercados de foco para a DefinedCrowd são os Estados Unidos e a Ásia. “Talvez noutra fase Portugal possa estar no nosso horizonte de vendas”, sugere Catarina Salteiro, que aponta para um “crescimento bastante interessante do mercado de inteligência artificial” no país e diz que “existem cada vez mais empresas a utilizarem” este tipo de tecnologias. “Dá-nos a ideia de que as grandes empresas instaladas em Portugal também já têm esta sensibilidade para introduzirem a inteligência artificial nos seus negócios.”
Com um total de 13 milhões de dólares levantados em financiamento, a empresa não precisa de ir à procura de uma Série B em 2019, mas tal não é uma hipótese descartada. Um dos focos será anunciar mais parcerias estratégicas com grandes empresas, depois de Microsoft, IBM Watson e Amazon Alexa, e expandir os quadros.
“Os nossos objetivos para este ano estão focados na melhoria e refinamento do produto e para isso vamos precisar de um crescimento da equipa”, revela a diretora. A intenção é crescer para as 150 pessoas nos quatro escritórios da startup – Lisboa, Porto, Seattle e Tóquio, havendo muitas vagas abertas. Segundo Catarina Salteiro, continua a ser possível contratar talento em Portugal, mas não apenas profissionais portugueses. “Temos muitos estrangeiros a trabalhar connosco, muita gente que estava cá a estudar e ficou, muita gente que quis sair de onde estava para vir para Portugal porque Lisboa é um sítio incrível”, elogia. “Todas as semanas temos pessoas a chegar.”
Ana Rita Guerra, Los Angeles