En relation d'extraction (PNL), quelle est la différence entre l'extraction de relation supervisée, semi-supervisée et non supervisée?


Réponse 1:

Dans l'apprentissage supervisé, il existe un grand ensemble de données qui contient tout ce dont l'apprenant pourrait avoir besoin. Il contient des documents ainsi que toutes les relations entre les mots et le texte que vous souhaitez. L'apprenant doit apprendre à effectuer cette tâche sur des documents invisibles.

Dans l'apprentissage semi-supervisé, vous avez un grand ensemble de documents, et pour un sous-ensemble plus petit de ceux-ci, vous avez toutes les données.

Dans l'apprentissage non supervisé, l'apprenant n'a que des documents. Il peut rechercher des modèles intéressants qui sous-tendent les données. Ces modèles pourraient être significatifs, mais ils pourraient également être des artefacts aléatoires. Lorsque suffisamment de données sont présentes, il sera plus facile d'identifier des modèles significatifs. Cependant, sans un superviseur qui regarde les modèles, l'algorithme ne pourra pas lui donner de sens. Par exemple, il pourrait constater que les mots `` président '', `` Obama '' et `` Barack '' coexistent souvent, ou l'un se produit dans des situations où un autre est généralement trouvé (un indicateur qu'ils pourraient être des synonymes). En général, il ne peut pas trouver que cela décrit une personne.