GLOSSARIO
Ciência de Dados
O que é ciência de dados. Significado, conceito, para que serve e como funciona.
O que é ciência de dados?
Ciência de dados (data science) é uma área interdisciplinar voltada para o estudo e a análise de dados estatísticos.
→ Carteira Recomendada? Faça um Diagnóstico Online e Receba uma Carteira Gratuita.
Estes dados podem ser de natureza econômica, financeira, social, estruturados ou não-estruturados.
O objetivo básico da ciência de dados é a obtenção de conhecimento e detecção de padrões para possíveis tomadas de decisão.
A ciência de dados existe há 30 anos enquanto campo de estudo, porém ganhou mais destaque nos últimos anos.
Isso ocorreu devido a alguns fatores como o surgimento e popularização de grandes bancos de dados (Big Data) e o desenvolvimento de áreas como machine learning.
No setor privado, os cientistas de dados podem trabalhar manipulando a grande quantidade de dados brutos e extraindo insights que servirão para melhorar os negócios e os resultados das empresas.
Já na academia, centros de pesquisas e serviço público, a ciência de dados é mais aplicada para a realização de pesquisas quantitativas e interdisciplinares.
→ Ficou na Dúvida Sobre Investimentos? Baixe Grátis o Dicionário do Investidor.
A importância da ciência de dados?
A ciência de dados pode ser utilizada de inúmeras formas pelas empresas. Ela é aplicável nas áreas de produção, marketing, vendas, financeiro, RH e até mesmo jurídico.
Este artifício pode revelar informações fundamentais para a gestão da empresa, que não são percebidas pela análise comum.
A ciência de dados pode contribuir para a compreensão de tendências do cenário econômico e seus reflexos no mercado, bem como o comportamento dos consumidores.
No entanto, para que as empresas consigam colocá-la em prática, o profissional de dados precisa saber capturar, armazenar e processar os dados.
Esse processo é extremamente complexo, de forma que se faz necessário o uso de algoritmos para validar e direcionar a compreensão.
É importante destacar que a ciência de dados é diferente das análises estatísticas.
A principal razão disso é o chamado Big Data.
Atualmente o volume de dados gerado por ações online, como uma simples curtida no Facebook ou até o upload de vídeos ou fotos no Instagram, é enorme.
Por outro lado, junto com esse aumento na geração de dados, também aumentou a nossa capacidade de processamento.
É, portanto, a partir desse grande aumento na quantidade de dados e na capacidade de processamento que surgiu o conceito de Big Data e a prática da ciência de dados.
A realização da análise desta grande quantidade de dados demanda o uso de diferentes tecnologias com relação à análise estatística.
Desta forma, frente à enorme quantidade de dados, cuja atualização ocorre praticamente em tempo real, argumenta-se que profissionais de estatísticas não têm os meios suficientes para fazer uma análise profunda.
Nesse caso, a ciência de dados está constantemente buscando formas de processar esse montante enorme de dados que são gerados a todo momento.
Como nossa vida continua a ser cada vez mais digital, é crucial para as empresas abraçarem essa nova filosofia baseada na ciência para tomar decisões direcionadas.
Como é utilizado a ciência de dados?
Um dos pontos mais importantes no processo de gerar valor para as companhias na área de ciência de dados é o processo de modelagem.
Nesta prática, diversos modelos (centenas ou milhares) são treinados com o uso de diversas técnicas de inteligência artificial (machine learning)
O propósito de todas essas modelagens é encontrar as inter-relações entre as variáveis, com a ajuda de inteligência artificial, e gerar resultados como:
- predições: probabilidade de ocorrência de um evento dado um conjunto de características;
- previsões: projeções de como será o futuro a partir de um conjunto de séries temporais;
- análise de perfis: identificação de pessoas, categorizando-as em grupos de indivíduos similares dentro do conjunto de dados, ou grupos de outliers (indivíduos que possuem características muito diferentes dos demais);
criação de cenários: identificar grupos que impactam positiva ou negativamente em um target (uma variável a ser explicada).