Skip to content Skip to sidebar Skip to footer

Comment structure T-ON des données ?

Comment structure T-ON des données ?

Quel est le pire aliment pour le cholestérol ? Les principaux aliments à limiter, voire à éviter sont : Quand le Bitcoin est à 1 euro ? 2011. – février : Bitcoin atteint la parité avec le dollar puis, quelques jours plus tard, avec l’euro. Est-ce que le 32 44 est gratuit ? Appeler Free pour les abonnés : le 3244 Depuis une ligne Freebox, le temps d’attente est gratuit puis l’appel est facturé au prix d’une communication locale, soit 0,078 €TTC par appel puis 0,028 €TTC/min en heures pleines et 0,014 €TTC/min en heures creuses.4 oct. 2022 Qui a 1000 buts ? Pelé Quels sont les chiens les plus feignant ? 1. Les Bouledogues Anglais. Sans aucun doute, les Bouledogues Anglais sont les chiens les plus fainéants du monde.24 avr. 2016


Bonjour Guillaume Ah la hotline ! Alors, qu’est-ce qui vous amène aujourd’hui ? J’ai une amie DJ qui voudrait se lancer dans la création d’une webradio. On pense tout de suite à des playlists thématiques electro, world, sixties, musiques de films… Mais pourquoi pas des trucs un peu plus originaux comme rock chevelu des reprises électro bossa nova des titres brésiliens, du rap féminin… J’ai tous ses fichiers mp3 classés par album dans sa discothèque Comment je procède pour générer les playlists ? Il faudrait que ça soit automatique ! Evidemment ! Ça sert à ça l’informatique, à faire du traitement automatique de l’information ! Mais tout d’abord il faut avoir en tête que l’ordinateur ne traite pas de la musique mais des données n’est-ce pas Guillaume ? Une donnée est une valeur décrivant un objet. Les données peuvent être de différents types : un texte, une valeur numérique, une date, etc… Par exemple : 4 minutes 34 secondes est une donnée de type numérique correspondant à la durée d’un morceau de musique. Mais elle ne suffit pas à identifier le morceau. Il faut souvent plusieurs données pour décrire un même objet. Une première étape consiste donc à définir les catégories de données nécessaires pour identifier un objet de manière unique et effectuer les opérations que l’on souhaite. Attention, pour pouvoir être comparées les données de chaque catégorie doivent être du même type. Le titre sous forme textuelle, la durée en seconde, le style choisi parmi une liste de mots clés, etc… Et, je ne peux pas simplement faire une recherche dans les paroles des chansons par exemple ? Ce sont des données textuelles. Oui c’est possible mais vous ne pourrez pas en faire grand chose Guillaume, car ce sont des données “non structurées”. Pour traiter automatiquement les données, il faut les organiser de manière à pouvoir s’y retrouver facilement les ranger en quelque sorte. On appelle cela “structurer les données”. Ranger ! Vous n’avez pas vu chez moi ! Je pensais que l’idée était de déléguer les tâches ingrates aux machines. Patience Guillaume. Voyez-vous plutôt en architecte du rangement ! Pour structurer les données on va créer ce qu’on appelle une table dans laquelle on va regrouper toutes les informations relatives aux morceaux de musique. On peut voir ça comme un tableau où à chaque colonne correspond une catégorie de donnée ou descripteur : durée, interprète principal, année, style… et à chaque ligne correspond un objet. On peut ensuite remplir ces tables à la main ou faire une moulinette un petit programme pour automatiser l’indexation des données et déléguer cette tâche à la machine. Héhé une moulinette, ça me plait bien ça ! Vous trouverez sûrement une partie des informations nécessaires dans les métadonnées qui accompagnent tout fichier numérique pour en décrire le contenu ou dans des fichiers de données ouvertes. Une fois que les données sont structurées il est possible d’effectuer toutes sortes d’opérations dessus en utilisant ce que l’ordinateur sait faire bien mieux et bien plus rapidement que vous : des opérations ! Vous allez pouvoir, en un claquement de clic : rechercher toutes les chansons d’un même style, ou uniquement les plus récentes, calculer la durée totale de l’ensemble de ces morceaux. Ou bien rechercher toutes les versions d’un même titre les trier en fonction de leur date de sortie et hop une nouvelle playlist ! Et si je veux trouver tous les titres d’interprètes aux cheveux rouges ? Dans ce cas il faut créer une autre table contenant, pour chaque interprète, toutes les informations utiles : nationalité, date de naissance, sexe, couleur de cheveux, etc. Il suffit ensuite de croiser les deux tables pour avoir à la fois les informations sur les morceaux et sur l’interprète. Une autre table ? Pourquoi ne pas mettre directement la couleur des cheveux de l’interprète dans la table des morceaux de musique ? Il faudrait noter toutes les informations concernant l’interprète sur chaque morceau. Et si l’interprète change de couleur de cheveux, il faudrait changer cette information partout, sur chaque morceau ! Et ça Guillaume, c’est un travail que vous pouvez éviter ! Une base de données peut comporter plusieurs tables que l’on peut croiser si elles possèdent un descripteur commun ou comparable, ici, l’interprète. On parle de base de données relationnelles. Ce sont des outils extrêmement puissants, car en croisant les informations de la sorte, on peut en obtenir de nouvelles. En 2001, un chercheur américain a montré qu’il était possible d’accéder aux données médicales individuelles des électeurs de son état en croisant la liste électorale avec une base de données médicales qui ne comportait pourtant pas leur nom. Avec l’énorme quantité de données aujourd’hui disponibles préserver l’anonymat est un vrai enjeu pour la recherche. OK je comprends mieux l’importance du Règlement Général sur la Protection des Données Bon il faudra que l’on fasse bien attention aux données des utilisateurs de notre web radio ! Ce serait dommage que les gens se moquent de moi parce que j’aime les chansons de…. De qui, Guillaume ? Je ne vous le dirai pas !

Leave a comment