| Data Miner |
|
|
|
O que é Data Mining? Data Mining ou Mineração de Dados é a procura de relações e padrões globais que existem em bancos de dados, mas que estão escondidos pela vasta quantidade de informações, como um relacionamento entre dados de um paciente e seu diagnóstico médico. Estes relacionamentos representam conhecimento de valor sobre bancos de dados e objetos do banco de dados, podendo ser utilizados para decisões estratégias ou comerciais. Por exemplo, tarefas como: - identificar o perfil dos clientes compradores potenciais de determinados tipos de produtos. - descobrir produtos que freqüentemente são comprados juntos. - encontrar grupos distintos de clientes com características semelhantes. Existem inúmeras técnicas descritas na literatura da área que permitem obter conhecimento de bases de dados. No sistema Data Miner, optou-se pelo uso de 3 técnicas de características distintas, descritas a seguir: Árvores de Decisão - É um sistema de classificação, ou seja, que permite classificar um dado a partir de outros dados. - Exemplo: A partir das informações: idade, sexo, classe social, cidade, estado civil e outros dados, classificar o perfil de compra dos clientes. - Para obter um modelo de classificação, deve-se fornecer dados do passado (como transações financeiras realizadas pelos clientes nos últimos 6 meses) para que o sistema possa “induzir” um padrão geral nos dados que será representado pela saída de execução. - A saída da execução é uma árvore que representa na forma de galhos os critérios que são utilizados para classificar os registros. - Exemplo: -Se idade=entre 20 e 40 anos -Se Sexo=masculino - Se estado civil=casado - Perfil de compra=ótimo - A partir de uma árvore de decisão gerada, é possível aplicá-la em novos dados para verificar a sua taxa de acerto, ou seja, o qual verdadeiras as regras propostas são, ou simular a partir de novos dados qual seria a resposta da árvore. Clustering - Permite agrupar os dados em conjuntos homogêneos. O número de conjuntos não precisa ser fornecido, de tal forma que o sistema tentará encontrar de forma automática os possíveis agrupamentos nos dados. - Cada agrupamento será depois descrito pelas suas principais características, que permitirá fornecer “rótulos” aos grupos, como por exemplo: “Grupo dos clientes que compram determinados produtos” ou “Grupo dos clientes com perfil diferenciado de compra”. Regra de Associação - É uma das aplicações mais “clássicas” de Data Mining. - Regras de Associação encontram padrões entre dados binários, expressos a partir e regras no formato SE... ENTÃO. - As regras são obtidas a partir de um determinado nível de relevância mínimo pré-estabelecido (graus de suporte e confiança). - O caso mais comum é a “Basket Data Analysis”, que visa encontrar itens que são freqüentemente comprados juntos pelos clientes. - Exemplo: Se um cliente compra cerveja então compra fraldas (Suporte: 3% Confiança: 80%) - O exemplo acima corresponde a um caso real aonde um supermercado descobriu que clientes que são casados, pais e novos costumam comprar fraldas e cervejas. Em posse deste conhecimento, um supermercado pode decidir colocar os produtos próximos ou oferecer promoções na compra conjunta. - Entretanto, regras de associação não servem somente para analisar produtos que são comprados em conjunto, podendo ser aplicadas para encontrar padrões quaisquer entre dados que ocorrem de forma conjunta. |
| < Anterior | Próximo > |
|---|

