Les pièges des »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő des mĂ©dias sociaux
Or, de plus en plus, des lacunes sont dĂ©montrĂ©es dans bon nombre de ces Ă©tudes, d’oĂą la nĂ©cessitĂ©, pour les chercheurs, d’éviter les pièges redoutables de l’utilisation de vastes corpus de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociaux, selon des informaticiens de l’UniversitĂ©ĚýMcGill, Ă MontrĂ©al, et de l’UniversitĂ©ĚýCarnegieĚýMellon, Ă Pittsburgh.
Ces rĂ©sultats erronĂ©s peuvent avoir de lourdes consĂ©quences. En effet, chaque annĂ©e, des milliers d’articles de recherche reposent maintenant sur les »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociaux. «ĚýBon nombre de ces articles sont utilisĂ©s par le public, l’industrie et le gouvernement pour motiver et justifier des dĂ©cisions et des investissements Ěý», affirme DerekĚýRuths, professeur adjoint Ă l’École d’informatique de l’UniversitĂ©ĚýMcGill.
Dans un article publiĂ© dans le numĂ©ro du 28ĚýnovembreĚý2014 de la revue scientifique Science, DerekĚýRuths et JĂĽrgenĚýPfeffer, de l’Institut de recherche logicielle de l’UniversitĂ© Carnegie Mellon, font ressortir plusieurs problèmes associĂ©s Ă l’utilisation de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociauxĚý– et proposent des stratĂ©gies permettant de les surmonter. Ils mentionnent notamment les problèmes suivantsĚý:
- les diverses plateformes de mĂ©dias sociaux attirent diffĂ©rents types d’utilisateurs. Pinterest, par exemple, intĂ©resse surtout les femmes de 25 Ă 34Ěýans, mais les chercheurs corrigent rarement l’image biaisĂ©e que ces Ă©chantillons peuvent donner;
- les sources de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő accessibles publiquement reflètent rarement l’ensemble des »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő des mĂ©dias sociaux, et les chercheurs ignorent gĂ©nĂ©ralement quand et comment les mĂ©dias sociaux filtrent leurs flux de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő;
- la conception des plateformes de mĂ©dias sociaux peut dicter la façon dont les utilisateurs se comportent et, par consĂ©quent, le type de comportements qu’il est possible de mesurer. Ainsi, sur Facebook, l’absence d’un bouton «Ěýje n’aime pasĚý» rend plus difficile la dĂ©tection de rĂ©actions nĂ©gatives au contenu que la prĂ©sence d’un bouton «Ěýj’aimeĚý» tĂ©moignant de rĂ©actions positives;
- un grand nombre de polluposteurs («ĚýspammersĚý») Ěýet de bots, qui se font passer pour des utilisateurs normaux sur les mĂ©dias sociaux, sont intĂ©grĂ©s par erreur Ă de nombreuses mesures et prĂ©dictions du comportement humain;
- les chercheurs font souvent Ă©tat de leurs rĂ©sultats pour des groupes d’utilisateurs, de sujets et d’évĂ©nements faciles Ă classifier, donnant ainsi l’illusion que les nouvelles mĂ©thodes sont plus exactes qu’elles ne le sont en rĂ©alitĂ©. Ainsi, les efforts visant Ă dĂ©terminer l’orientation politique d’utilisateurs de Twitter ne sont exacts qu’ 65Ěý% dans le cas des utilisateurs types, et ce, mĂŞme si certaines Ă©tudes (basĂ©es sur des utilisateurs politiquement actifs) ont fait Ă©tat d’une exactitude de 90Ěý%.
Selon DerekĚýRuths et JĂĽrgenĚýPfeffer, des solutions bien connues Ă bon nombre de ces problèmes ont dĂ©jĂ Ă©tĂ© trouvĂ©es par des disciplines telles que l’épidĂ©miologie, la statistique et l’apprentissage machine. «ĚýCes problèmes ont ceci en commun que les chercheurs doivent savoir exactement ce qu’ils analysent rĂ©ellement lorsqu’ils travaillent Ă l’aide de »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociauxĚý», affirme DerekĚýRuths.
Les spĂ©cialistes des sciences sociales ont dĂ©jĂ affinĂ© leurs normes et leurs techniques afin de relever ce type de dĂ©fi avec succès. «ĚýLa cĂ©lèbre manchette de 1948 “Dewey dĂ©fait Truman” vient du fait que les sondages tĂ©lĂ©phoniques avaient sous-Ă©chantillonnĂ© les partisans de Truman dans la population gĂ©nĂ©raleĚý», explique le professeurĚýRuths. «ĚýOr, plutĂ´t que de discrĂ©diter de façon permanente le recours aux sondages, cette erreur monumentale a menĂ© aux mĂ©thodes de sondage plus Ă©voluĂ©es et plus exactes, ainsi qu’aux normes plus strictes que nous connaissons aujourd’hui. Nous en sommes maintenant Ă un tournant technologique semblable. En nous attaquant Ă ces problèmes, nous pourrons mesurer pleinement les avantages que comporte la recherche fondĂ©e sur les »ĺ´Ç˛Ô˛ÔĂ©±đ˛ő issues des mĂ©dias sociaux.Ěý»
--------------Ěý
Social Media for Large Studies of Behavior, DerekĚýRuths et JĂĽrgenĚýPfeffer, Science, 28ĚýnovembreĚý2014.Ěý
Ěý
Ěý