Sistema de recomendação - Recommender system

Um sistema de recomendação , ou um sistema de recomendação (às vezes substituindo 'sistema' por um sinônimo como plataforma ou motor), é uma subclasse de sistema de filtragem de informações que busca prever a "classificação" ou "preferência" que um usuário daria a um item .

Os sistemas de recomendação são usados ​​em uma variedade de áreas, com exemplos comumente reconhecidos na forma de geradores de lista de reprodução para serviços de vídeo e música, recomendadores de produtos para lojas online ou recomendadores de conteúdo para plataformas de mídia social e recomendadores de conteúdo aberto da web. Esses sistemas podem operar usando uma única entrada, como música, ou várias entradas dentro e entre plataformas, como notícias, livros e consultas de pesquisa. Existem também sistemas de recomendação populares para tópicos específicos, como restaurantes e encontros online . Sistemas de recomendação também foram desenvolvidos para explorar artigos de pesquisa e especialistas, colaboradores e serviços financeiros.

Visão geral

Os sistemas de recomendação geralmente usam um ou ambos os filtros colaborativos e os filtros baseados em conteúdo (também conhecido como abordagem baseada na personalidade), bem como outros sistemas, como sistemas baseados em conhecimento . As abordagens de filtragem colaborativa constroem um modelo a partir do comportamento anterior de um usuário (itens previamente adquiridos ou selecionados e / ou classificações numéricas dadas a esses itens), bem como decisões semelhantes feitas por outros usuários. Este modelo é então usado para prever itens (ou classificações de itens) nos quais o usuário pode ter interesse. As abordagens de filtragem baseada em conteúdo utilizam uma série de características discretas e pré-marcadas de um item para recomendar itens adicionais com propriedades semelhantes . Os sistemas de recomendação atuais geralmente combinam uma ou mais abordagens em um sistema híbrido.

As diferenças entre a filtragem colaborativa e a baseada em conteúdo podem ser demonstradas comparando dois sistemas antigos de recomendação de música - Last.fm e Pandora Radio .

  • Last.fm cria uma "estação" de músicas recomendadas observando quais bandas e faixas individuais o usuário ouviu regularmente e comparando-as com o comportamento de escuta de outros usuários. Last.fm irá reproduzir faixas que não aparecem na biblioteca do usuário, mas são frequentemente reproduzidas por outros usuários com interesses semelhantes. Como essa abordagem potencializa o comportamento dos usuários, é um exemplo de técnica de filtragem colaborativa.
  • O Pandora usa as propriedades de uma música ou artista (um subconjunto dos 400 atributos fornecidos pelo Projeto Genoma Musical ) para semear uma "estação" que reproduz música com propriedades semelhantes. O feedback do usuário é usado para refinar os resultados da estação, sem enfatizar certos atributos quando um usuário "não gosta" de uma determinada música e enfatizando outros atributos quando um usuário "gosta" de uma música. Este é um exemplo de abordagem baseada em conteúdo.

Cada tipo de sistema tem seus pontos fortes e fracos. No exemplo acima, o Last.fm requer uma grande quantidade de informações sobre um usuário para fazer recomendações precisas. Este é um exemplo do problema de inicialização a frio e é comum em sistemas de filtragem colaborativa. Enquanto o Pandora precisa de muito pouca informação para começar, ele é muito mais limitado em escopo (por exemplo, ele só pode fazer recomendações semelhantes à semente original).

Os sistemas de recomendação são uma alternativa útil aos algoritmos de pesquisa, pois ajudam os usuários a descobrir itens que, de outra forma, não teriam encontrado. É importante ressaltar que os sistemas de recomendação são frequentemente implementados usando mecanismos de pesquisa que indexam dados não tradicionais.

Os sistemas de recomendação foram mencionados pela primeira vez em um relatório técnico como uma "estante digital" em 1990 por Jussi Karlgren na Universidade de Columbia, e implementados em escala e trabalhados em relatórios técnicos e publicações de 1994 em diante por Jussi Karlgren, então no SICS, e grupos de pesquisa liderado por Pattie Maes no MIT, Will Hill na Bellcore e Paul Resnick , também no MIT, cujo trabalho com GroupLens foi premiado com o 2010 ACM Software Systems Award .

Montaner forneceu a primeira visão geral dos sistemas de recomendação de uma perspectiva de agente inteligente. Adomavicius forneceu uma visão geral nova e alternativa dos sistemas de recomendação. Herlocker fornece uma visão geral adicional das técnicas de avaliação para sistemas de recomendação e Beel et al. discutiu os problemas das avaliações offline. Beel et al. também forneceram pesquisas de literatura sobre os sistemas de recomendação de papéis de pesquisa disponíveis e os desafios existentes.

Os sistemas de recomendação têm sido o foco de várias patentes concedidas.

Abordagens

Filtragem colaborativa

Um exemplo de filtragem colaborativa com base em um sistema de classificação

Uma abordagem para o projeto de sistemas de recomendação que tem amplo uso é a filtragem colaborativa . A filtragem colaborativa é baseada na suposição de que as pessoas que concordaram no passado concordarão no futuro e que irão gostar de tipos de itens semelhantes aos que gostavam no passado. O sistema gera recomendações usando apenas informações sobre perfis de classificação para diferentes usuários ou itens. Localizando usuários / itens de mesmo nível com um histórico de classificação semelhante ao do usuário ou item atual, eles geram recomendações usando essa vizinhança. Os métodos de filtragem colaborativa são classificados como baseados em memória e baseados em modelo. Um exemplo bem conhecido de abordagens baseadas em memória é o algoritmo baseado em usuário, enquanto o de abordagens baseadas em modelo é o Kernel-Mapping Recommendation .

Uma vantagem principal da abordagem de filtragem colaborativa é que ela não depende de conteúdo analisável por máquina e, portanto, é capaz de recomendar com precisão itens complexos, como filmes, sem exigir uma "compreensão" do próprio item. Muitos algoritmos têm sido usados ​​para medir a similaridade do usuário ou similaridade do item em sistemas de recomendação. Por exemplo, a abordagem de k-vizinho mais próximo (k-NN) e a correlação de Pearson implementada pela primeira vez por Allen.

Ao construir um modelo a partir do comportamento de um usuário, geralmente é feita uma distinção entre as formas explícitas e implícitas de coleta de dados .

Exemplos de coleta de dados explícita incluem o seguinte:

  • Pedir a um usuário para classificar um item em uma escala móvel.
  • Pedir a um usuário para pesquisar.
  • Pedir a um usuário para classificar uma coleção de itens dos favoritos aos menos favoritos.
  • Apresentar dois itens a um usuário e pedir-lhe que escolha o melhor deles.
  • Pedir a um usuário para criar uma lista de itens de que gosta (consulte a classificação de Rocchio ou outras técnicas semelhantes).

Exemplos de coleta de dados implícitos incluem o seguinte:

  • Observando os itens que um usuário visualiza em uma loja online.
  • Analisando os tempos de visualização do item / usuário.
  • Manter um registro dos itens que um usuário compra online.
  • Obter uma lista de itens que um usuário ouviu ou assistiu em seu computador.
  • Analisar a rede social do usuário e descobrir gostos e desgostos semelhantes.

As abordagens de filtragem colaborativa geralmente apresentam três problemas: inicialização a frio , escalabilidade e dispersão.

  • Inicialização a frio : para um novo usuário ou item, não há dados suficientes para fazer recomendações precisas. Nota: uma solução comumente implementada para este problema é o algoritmo de bandido multi-armado .
  • Escalabilidade : em muitos dos ambientes nos quais esses sistemas fazem recomendações, existem milhões de usuários e produtos. Portanto, muitas vezes é necessário um grande poder de computação para calcular as recomendações.
  • Escassez : o número de itens vendidos nos principais sites de comércio eletrônico é extremamente grande. Os usuários mais ativos terão avaliado apenas um pequeno subconjunto do banco de dados geral. Portanto, mesmo os itens mais populares têm poucas avaliações.

Um dos exemplos mais famosos de filtragem colaborativa é a filtragem colaborativa item a item (pessoas que compram x também compram y), um algoritmo popularizado pelo sistema de recomendação da Amazon.com .

Muitas redes sociais originalmente usavam filtragem colaborativa para recomendar novos amigos, grupos e outras conexões sociais examinando a rede de conexões entre um usuário e seus amigos. A filtragem colaborativa ainda é usada como parte de sistemas híbridos.

Filtragem baseada em conteúdo

Outra abordagem comum ao projetar sistemas de recomendação é a filtragem baseada em conteúdo . Os métodos de filtragem baseados em conteúdo são baseados em uma descrição do item e um perfil das preferências do usuário. Esses métodos são mais adequados para situações em que existem dados conhecidos sobre um item (nome, localização, descrição, etc.), mas não sobre o usuário. Os recomendadores baseados em conteúdo tratam a recomendação como um problema de classificação específico do usuário e aprendem um classificador para os gostos e desgostos do usuário com base nos recursos de um item.

Neste sistema, palavras-chave são usadas para descrever os itens e um perfil de usuário é construído para indicar o tipo de item que esse usuário gosta. Em outras palavras, esses algoritmos tentam recomendar itens semelhantes aos que o usuário gostou no passado ou está examinando no presente. Ele não depende de um mecanismo de entrada do usuário para gerar esse perfil geralmente temporário. Em particular, vários itens candidatos são comparados com itens avaliados anteriormente pelo usuário e os itens mais adequados são recomendados. Essa abordagem tem suas raízes na pesquisa de recuperação de informações e filtragem de informações .

Para criar um perfil de usuário , o sistema se concentra principalmente em dois tipos de informações:

1. Um modelo de preferência do usuário.

2. Um histórico da interação do usuário com o sistema de recomendação.

Basicamente, esses métodos usam um perfil de item (ou seja, um conjunto de atributos e recursos discretos) que caracteriza o item dentro do sistema. Para abstrair os recursos dos itens no sistema, um algoritmo de apresentação de itens é aplicado. Um algoritmo amplamente usado é a representação tf – idf (também chamada de representação em espaço vetorial). O sistema cria um perfil de usuários baseado em conteúdo com base em um vetor ponderado de recursos de itens. Os pesos denotam a importância de cada recurso para o usuário e podem ser calculados a partir de vetores de conteúdo classificados individualmente usando uma variedade de técnicas. Abordagens simples usam os valores médios do vetor de itens avaliados, enquanto outros métodos sofisticados usam técnicas de aprendizado de máquina, como classificadores bayesianos , análise de cluster , árvores de decisão e redes neurais artificiais para estimar a probabilidade de que o usuário goste do item.

Uma questão importante com a filtragem baseada em conteúdo é se o sistema é capaz de aprender as preferências do usuário a partir das ações dos usuários em relação a uma fonte de conteúdo e usá-las em outros tipos de conteúdo. Quando o sistema está limitado a recomendar conteúdo do mesmo tipo que o usuário já está usando, o valor do sistema de recomendação é significativamente menor do que quando outros tipos de conteúdo de outros serviços podem ser recomendados. Por exemplo, recomendar artigos de notícias com base na navegação por notícias é útil, mas seria muito mais útil quando música, vídeos, produtos, discussões etc. de diferentes serviços podem ser recomendados com base na navegação por notícias. Para superar isso, a maioria dos sistemas de recomendação baseados em conteúdo agora usa alguma forma de sistema híbrido.

Os sistemas de recomendação baseados em conteúdo também podem incluir sistemas de recomendação baseados em opinião. Em alguns casos, os usuários podem deixar uma revisão de texto ou feedback sobre os itens. Esses textos gerados pelo usuário são dados implícitos para o sistema de recomendação porque são um recurso potencialmente rico em recursos / aspectos do item e na avaliação / sentimento dos usuários em relação ao item. Os recursos extraídos das revisões geradas pelo usuário são metadados aprimorados de itens, porque, como também refletem aspectos do item, como metadados , os recursos extraídos são amplamente considerados pelos usuários. Os sentimentos extraídos das avaliações podem ser vistos como pontuações de classificação dos usuários nos recursos correspondentes. Abordagens populares de sistema de recomendação baseado em opinião utilizam várias técnicas, incluindo mineração de texto , recuperação de informações , análise de sentimento (consulte também Análise de sentimento multimodal ) e aprendizado profundo.

Sistemas de recomendação baseados em sessão

Esses sistemas de recomendação usam as interações de um usuário em uma sessão para gerar recomendações. Os sistemas de recomendação baseados em sessão são usados ​​no Youtube e na Amazon. Eles são particularmente úteis quando o histórico (como cliques anteriores, compras) de um usuário não está disponível ou não é relevante na sessão atual do usuário. Os domínios onde as recomendações baseadas em sessão são particularmente relevantes incluem vídeo, comércio eletrônico, viagens, música e muito mais. A maioria das instâncias de sistemas de recomendação baseados em sessão dependem da sequência de interações recentes dentro de uma sessão, sem exigir nenhum detalhe adicional (histórico, demográfico) do usuário. As técnicas para recomendações baseadas em sessão são baseadas principalmente em modelos sequenciais generativos, como Redes Neurais Recorrentes, Transformadores e outras abordagens baseadas em aprendizagem profunda

Aprendizagem de reforço para sistemas de recomendação

O problema de recomendação pode ser visto como uma instância especial de um problema de aprendizagem por reforço em que o usuário é o ambiente sobre o qual o agente, o sistema de recomendação atua para receber uma recompensa, por exemplo, um clique ou engajamento do usuário. Um aspecto do aprendizado por reforço que é de uso particular na área de sistemas de recomendação é o fato de que os modelos ou políticas podem ser aprendidos fornecendo uma recompensa ao agente de recomendação. Isso está em contraste com as técnicas de aprendizagem tradicionais que dependem de abordagens de aprendizagem supervisionada que são menos flexíveis. As técnicas de recomendação de aprendizagem por reforço permitem treinar modelos potencialmente que podem ser otimizados diretamente nas métricas de engajamento e interesse do usuário.

Sistemas de recomendação multicritério

Os sistemas de recomendação multicritério (MCRS) podem ser definidos como sistemas de recomendação que incorporam informações de preferência sobre vários critérios. Em vez de desenvolver técnicas de recomendação com base em um único valor de critério, a preferência geral do usuário u para o item i, esses sistemas tentam prever uma classificação para itens inexplorados de u explorando informações de preferência em vários critérios que afetam esse valor de preferência geral. Vários pesquisadores abordam o MCRS como um problema de tomada de decisão multicritério (MCDM) e aplicam métodos e técnicas MCDM para implementar sistemas MCRS. Veja este capítulo para uma introdução estendida.

Sistemas de recomendação com consciência de risco

A maioria das abordagens existentes para sistemas de recomendação concentra-se em recomendar o conteúdo mais relevante aos usuários usando informações contextuais, mas não leva em consideração o risco de perturbar o usuário com notificações indesejadas. É importante considerar o risco de incomodar o usuário pressionando recomendações em certas circunstâncias, por exemplo, durante uma reunião profissional, de manhã cedo ou tarde da noite. Portanto, o desempenho do sistema de recomendação depende em parte do grau em que ele incorporou o risco no processo de recomendação. Uma opção para gerenciar esse problema é o DRARS , um sistema que modela a recomendação baseada no contexto como um problema de bandido . Este sistema combina uma técnica baseada em conteúdo e um algoritmo de bandido contextual.

Sistemas de recomendação móvel

Os sistemas de recomendação móvel usam smartphones com acesso à Internet para oferecer recomendações personalizadas e sensíveis ao contexto. Esta é uma área de pesquisa particularmente difícil, pois os dados móveis são mais complexos do que os dados com os quais os sistemas de recomendação geralmente precisam lidar. É heterogêneo, ruidoso, requer autocorrelação espacial e temporal e apresenta problemas de validação e generalidade.

Existem três fatores que podem afetar os sistemas de recomendação móvel e a precisão dos resultados de previsão: o contexto, o método de recomendação e a privacidade. Além disso, os sistemas de recomendação móvel sofrem de um problema de transplante - as recomendações podem não se aplicar a todas as regiões (por exemplo, não seria aconselhável recomendar uma receita em uma área onde todos os ingredientes podem não estar disponíveis).

Um exemplo de sistema de recomendação móvel são as abordagens adotadas por empresas como Uber e Lyft para gerar rotas de direção para motoristas de táxi em uma cidade. Este sistema usa dados de GPS das rotas que os taxistas fazem durante o trabalho, que incluem localização (latitude e longitude), carimbos de hora e status operacional (com ou sem passageiros). Ele usa esses dados para recomendar uma lista de pontos de embarque ao longo de uma rota, com o objetivo de otimizar os tempos de ocupação e os lucros.

Sistemas de recomendação híbridos

A maioria dos sistemas de recomendação agora usa uma abordagem híbrida, combinando filtragem colaborativa , filtragem baseada em conteúdo e outras abordagens. Não há razão para que várias técnicas diferentes do mesmo tipo não possam ser hibridizadas. As abordagens híbridas podem ser implementadas de várias maneiras: fazendo previsões baseadas em conteúdo e baseadas em colaboração separadamente e, em seguida, combinando-as; adicionando recursos baseados em conteúdo a uma abordagem baseada em colaboração (e vice-versa); ou unificando as abordagens em um modelo (consulte Recursos para uma revisão completa dos sistemas de recomendação). Vários estudos que comparam empiricamente o desempenho do híbrido com os métodos puros colaborativos e baseados em conteúdo e demonstraram que os métodos híbridos podem fornecer recomendações mais precisas do que as abordagens puras. Esses métodos também podem ser usados ​​para superar alguns dos problemas comuns em sistemas de recomendação, como inicialização a frio e o problema de dispersão, bem como o gargalo da engenharia do conhecimento em abordagens baseadas no conhecimento .

O Netflix é um bom exemplo do uso de sistemas de recomendação híbridos. O site faz recomendações comparando os hábitos de visualização e pesquisa de usuários semelhantes (ou seja, filtragem colaborativa), bem como oferecendo filmes que compartilham características com filmes que um usuário classificou muito (filtragem baseada em conteúdo).

Algumas técnicas de hibridização incluem:

  • Ponderado : Combinando numericamente a pontuação de diferentes componentes de recomendação.
  • Alternar : escolher entre os componentes de recomendação e aplicar o selecionado.
  • Misto : as recomendações de diferentes recomendadores são apresentadas em conjunto para dar a recomendação.
  • Combinação de recursos : recursos derivados de diferentes fontes de conhecimento são combinados e fornecidos a um único algoritmo de recomendação.
  • Aumento de recursos : Computando um recurso ou conjunto de recursos, que é, então, parte da entrada para a próxima técnica.
  • Cascata : os recomendações recebem prioridade estrita, com os de prioridade mais baixa quebrando o empate na pontuação dos mais altos.
  • Meta-nível : Uma técnica de recomendação é aplicada e produz algum tipo de modelo, que é então a entrada usada pela próxima técnica.

O Prêmio Netflix

Um dos eventos que dinamizou a pesquisa em sistemas de recomendação foi o Prêmio Netflix . De 2006 a 2009, a Netflix patrocinou uma competição, oferecendo um grande prêmio de US $ 1.000.000 para a equipe que pudesse pegar um conjunto de dados oferecido de mais de 100 milhões de avaliações de filmes e recomendações de retorno que eram 10% mais precisas do que as oferecidas pelo sistema de recomendação existente da empresa. Essa competição estimulou a busca por algoritmos novos e mais precisos. Em 21 de setembro de 2009, o grande prêmio de US $ 1.000.000 foi dado à equipe Pragmatic Chaos da BellKor usando regras de desempate.

O algoritmo mais preciso em 2007 usou um método de conjunto de 107 abordagens algorítmicas diferentes, combinadas em uma única previsão. Conforme declarado pelos vencedores, Bell et al .:

A precisão preditiva é substancialmente melhorada ao combinar vários preditores. Nossa experiência é que a maioria dos esforços deve ser concentrada em derivar abordagens substancialmente diferentes, em vez de refinar uma única técnica. Consequentemente, nossa solução é um conjunto de vários métodos.

Muitos benefícios acumulados na web devido ao projeto Netflix. Algumas equipes pegaram sua tecnologia e a aplicaram em outros mercados. Alguns membros da equipe que ficou em segundo lugar fundaram o Gravity R&D , um mecanismo de recomendação que está ativo na comunidade RecSys. 4-Tell, Inc. criou uma solução derivada do projeto Netflix para sites de comércio eletrônico.

Uma série de questões de privacidade surgiram em torno do conjunto de dados oferecido pela Netflix para a competição do Prêmio Netflix . Embora os conjuntos de dados fossem anônimos para preservar a privacidade do cliente, em 2007, dois pesquisadores da Universidade do Texas conseguiram identificar usuários individuais comparando os conjuntos de dados com as classificações de filmes no Internet Movie Database. Como resultado, em dezembro de 2009, um usuário anônimo da Netflix processou a Netflix em Doe v. Netflix, alegando que a Netflix violou as leis de comércio justo dos Estados Unidos e o Video Privacy Protection Act ao liberar os conjuntos de dados. Isso, assim como as preocupações da Federal Trade Commission , levou ao cancelamento de uma segunda competição do Prêmio Netflix em 2010.

Medidas de desempenho

A avaliação é importante para avaliar a eficácia dos algoritmos de recomendação. Para medir a eficácia dos sistemas de recomendação e comparar diferentes abordagens, três tipos de avaliações estão disponíveis: estudos de usuários, avaliações online (testes A / B) e avaliações offline.

As métricas comumente usadas são o erro médio quadrático e a raiz do erro quadrático médio , sendo que o último foi usado no Prêmio Netflix. As métricas de recuperação de informações, como precisão e recall ou DCG, são úteis para avaliar a qualidade de um método de recomendação. Diversidade, novidade e abrangência também são considerados aspectos importantes na avaliação. No entanto, muitas das medidas clássicas de avaliação são altamente criticadas.

Avaliar o desempenho de um algoritmo de recomendação em um conjunto de dados de teste fixo sempre será extremamente desafiador, pois é impossível prever com precisão as reações de usuários reais às recomendações. Portanto, qualquer métrica que calcule a eficácia de um algoritmo em dados offline será imprecisa.

Os estudos do usuário são em pequena escala. Algumas dezenas ou centenas de usuários recebem recomendações criadas por diferentes abordagens de recomendação e, em seguida, os usuários julgam quais recomendações são as melhores.

Em testes A / B, as recomendações são mostradas para normalmente milhares de usuários de um produto real, e o sistema de recomendação escolhe aleatoriamente pelo menos duas abordagens de recomendação diferentes para gerar recomendações. A eficácia é medida com medidas implícitas de eficácia, como taxa de conversão ou taxa de cliques .

As avaliações offline são baseadas em dados históricos, por exemplo, um conjunto de dados que contém informações sobre como os usuários classificaram filmes anteriormente.

A eficácia das abordagens de recomendação é então medida com base em quão bem uma abordagem de recomendação pode prever as classificações dos usuários no conjunto de dados. Embora uma classificação seja uma expressão explícita de se um usuário gostou de um filme, essa informação não está disponível em todos os domínios. Por exemplo, no domínio dos sistemas de recomendação de citações, os usuários normalmente não avaliam uma citação ou artigo recomendado. Nesses casos, as avaliações off-line podem usar medidas implícitas de eficácia. Por exemplo, pode-se presumir que um sistema de recomendação é eficaz e é capaz de recomendar o maior número possível de artigos contidos na lista de referência de um artigo de pesquisa. No entanto, esse tipo de avaliação offline é visto como crítico por muitos pesquisadores. Por exemplo, foi demonstrado que os resultados das avaliações offline têm baixa correlação com os resultados de estudos de usuários ou testes A / B. Um conjunto de dados popular para avaliação offline demonstrou conter dados duplicados e, portanto, levar a conclusões erradas na avaliação de algoritmos. Freqüentemente, os resultados das chamadas avaliações off-line não se correlacionam com a satisfação do usuário realmente avaliada. Isso provavelmente ocorre porque o treinamento offline é altamente inclinado para os itens altamente alcançáveis ​​e os dados de teste offline são altamente influenciados pelas saídas do módulo de recomendação online. Os pesquisadores concluíram que os resultados das avaliações off-line devem ser vistos de forma crítica.

Além da precisão

Normalmente, a pesquisa sobre sistemas de recomendação se preocupa em encontrar os algoritmos de recomendação mais precisos. No entanto, vários fatores também são importantes.

  • Diversidade - os usuários tendem a ficar mais satisfeitos com as recomendações quando há uma maior diversidade dentro da lista, por exemplo, itens de diferentes artistas.
  • Persistência do recomendador - em algumas situações, é mais eficaz mostrar novamente as recomendações ou permitir que os usuários avaliem novamente os itens do que mostrar novos itens. Há várias razões para isso. Os usuários podem ignorar os itens quando eles são exibidos pela primeira vez, por exemplo, porque não tiveram tempo para inspecionar as recomendações cuidadosamente.
  • Privacidade - os sistemas de recomendação geralmente precisam lidar com questões de privacidade porque os usuários precisam revelar informações confidenciais. Construir perfis de usuário usando filtragem colaborativa pode ser problemático do ponto de vista da privacidade. Muitos países europeus têm uma forte cultura de privacidade de dados , e cada tentativa de introduzir qualquer nível de perfil de usuário pode resultar em uma resposta negativa do cliente. Muitas pesquisas foram realizadas sobre as questões de privacidade em curso neste espaço. O Prêmio Netflix é particularmente notável pelas informações pessoais detalhadas divulgadas em seu conjunto de dados. Ramakrishnan et al. conduziram uma ampla visão geral das compensações entre personalização e privacidade e descobriram que a combinação de laços fracos (uma conexão inesperada que fornece recomendações fortuitas) e outras fontes de dados podem ser usadas para descobrir identidades de usuários em um conjunto de dados anônimo.
  • Dados demográficos do usuário - Beel et al. descobriram que os dados demográficos do usuário podem influenciar a satisfação dos usuários com as recomendações. Em seu artigo, eles mostram que usuários idosos tendem a se interessar mais por recomendações do que usuários mais jovens.
  • Robustez - Quando os usuários podem participar do sistema de recomendação, a questão da fraude deve ser abordada.
  • Serendipity - Serendipity é uma medida de "quão surpreendentes são as recomendações". Por exemplo, um sistema de recomendação que recomenda leite a um cliente em uma mercearia pode ser perfeitamente preciso, mas não é uma boa recomendação porque é um item óbvio para o cliente comprar. "[Serenditipity] serve a dois propósitos: primeiro, a chance de os usuários perderem o interesse porque o conjunto de opções é muito uniforme diminui. Segundo, esses itens são necessários para que os algoritmos aprendam e se aprimorem".
  • Confiança - Um sistema de recomendação tem pouco valor para um usuário se o usuário não confiar no sistema. A confiança pode ser construída por um sistema de recomendação, explicando como ele gera recomendações e por que recomenda um item.
  • Rotulagem - A satisfação do usuário com as recomendações pode ser influenciada pela rotulagem das recomendações. Por exemplo, no estudo citado , a taxa de cliques (CTR) para recomendações rotuladas como "Patrocinada" foi menor (CTR = 5,93%) do que a CTR para recomendações idênticas rotuladas como "Orgânicas" (CTR = 8,86%). Recomendações sem rótulo tiveram melhor desempenho (CTR = 9,87%) naquele estudo.

Reprodutibilidade

Os sistemas de recomendação são notoriamente difíceis de avaliar off-line, com alguns pesquisadores afirmando que isso levou a uma crise de reprodutibilidade nas publicações dos sistemas de recomendação. Uma pesquisa recente de um pequeno número de publicações selecionadas aplicando aprendizagem profunda ou métodos neurais ao problema de recomendação principal, publicado nas principais conferências (SIGIR, KDD, WWW, RecSys, IJCAI), mostrou que, em média, menos de 40% dos os artigos puderam ser reproduzidos pelos autores da pesquisa, com apenas 14% em algumas conferências. No geral, os estudos identificam 26 artigos, apenas 12 deles podem ser reproduzidos pelos autores e 11 deles podem ser superados por linhas de base muito mais antigas e mais simples, devidamente ajustadas em métricas de avaliação off-line. Os artigos consideram uma série de problemas potenciais na bolsa de pesquisa de hoje e sugere práticas científicas aprimoradas nessa área. Trabalhos mais recentes sobre o benchmarking de um conjunto dos mesmos métodos chegaram a resultados qualitativamente muito diferentes, em que os métodos neurais estavam entre os métodos de melhor desempenho. Métodos neurais e de aprendizado profundo para sistemas de recomendação têm sido usados ​​nas soluções vencedoras em vários desafios de sistemas de recomendação recentes, WSDM, RecSys Challenge. Além disso, os métodos de aprendizado neural e profundo são amplamente usados ​​na indústria, onde são amplamente testados. O tópico da reprodutibilidade não é novo nos sistemas de recomendação. Em 2011, Ekstrand, Konstan, et al. criticou que "atualmente é difícil reproduzir e estender os resultados da pesquisa de sistemas de recomendação" e que as avaliações "não são tratadas de forma consistente". Konstan e Adomavicius concluem que "a comunidade de pesquisa de Sistemas de Recomendação está enfrentando uma crise em que um número significativo de artigos apresenta resultados que contribuem pouco para o conhecimento coletivo [...] muitas vezes porque a pesquisa carece de [...] avaliação para ser devidamente julgada e, portanto, para fornecer contribuições significativas. " Como consequência, muitas pesquisas sobre sistemas de recomendação podem ser consideradas não reproduzíveis. Conseqüentemente, os operadores de sistemas de recomendação encontram pouca orientação na pesquisa atual para responder à pergunta, quais abordagens de recomendação usar em um sistema de recomendação. Said & Bellogín realizaram um estudo de artigos publicados na área, bem como compararam alguns dos frameworks mais populares para recomendação e encontraram grandes inconsistências nos resultados, mesmo quando os mesmos algoritmos e conjuntos de dados foram usados. Alguns pesquisadores demonstraram que pequenas variações nos algoritmos ou cenários de recomendação levaram a fortes mudanças na eficácia de um sistema de recomendação. Eles concluem que sete ações são necessárias para melhorar a situação atual: "(1) pesquisar outros campos de pesquisa e aprender com eles, (2) encontrar um entendimento comum sobre reprodutibilidade, (3) identificar e compreender os determinantes que afetam a reprodutibilidade, (4) ) conduzir experimentos mais abrangentes (5) modernizar as práticas de publicação, (6) promover o desenvolvimento e uso de estruturas de recomendação e (7) estabelecer diretrizes de melhores práticas para pesquisa de sistemas de recomendação. "

Veja também

Referências

Leitura adicional

Livros

Kim Falk (janeiro de 2019), Practical Recommendation Systems, Manning Publications, ISBN  9781617292705

Artigos científicos

links externos