[{"@context":"http:\/\/schema.org\/","@type":"BlogPosting","@id":"https:\/\/wiki.edu.vn\/en2fr\/wiki28\/copus-wikipedia-wikipedia\/#BlogPosting","mainEntityOfPage":"https:\/\/wiki.edu.vn\/en2fr\/wiki28\/copus-wikipedia-wikipedia\/","headline":"Copus – Wikipedia Wikipedia wiki","name":"Copus – Wikipedia Wikipedia wiki","description":"before-content-x4 Un article de Wikip\u00e9dia, l’encyclop\u00e9die libre after-content-x4 Base de donn\u00e9es de l’entreprise Le Enron corpus est une base de","datePublished":"2020-07-02","dateModified":"2020-07-02","author":{"@type":"Person","@id":"https:\/\/wiki.edu.vn\/en2fr\/wiki28\/author\/lordneo\/#Person","name":"lordneo","url":"https:\/\/wiki.edu.vn\/en2fr\/wiki28\/author\/lordneo\/","image":{"@type":"ImageObject","@id":"https:\/\/secure.gravatar.com\/avatar\/c9645c498c9701c88b89b8537773dd7c?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/c9645c498c9701c88b89b8537773dd7c?s=96&d=mm&r=g","height":96,"width":96}},"publisher":{"@type":"Organization","name":"Enzyklop\u00e4die","logo":{"@type":"ImageObject","@id":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","url":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","width":600,"height":60}},"image":{"@type":"ImageObject","@id":"https:\/\/upload.wikimedia.org\/wikipedia\/commons\/thumb\/4\/44\/Enron_Email_Network.jpg\/220px-Enron_Email_Network.jpg","url":"https:\/\/upload.wikimedia.org\/wikipedia\/commons\/thumb\/4\/44\/Enron_Email_Network.jpg\/220px-Enron_Email_Network.jpg","height":"220","width":"220"},"url":"https:\/\/wiki.edu.vn\/en2fr\/wiki28\/copus-wikipedia-wikipedia\/","wordCount":2309,"articleBody":" (adsbygoogle = window.adsbygoogle || []).push({});before-content-x4Un article de Wikip\u00e9dia, l’encyclop\u00e9die libre (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4Base de donn\u00e9es de l’entreprise Le Enron corpus est une base de donn\u00e9es de plus de 600 000 e-mails g\u00e9n\u00e9r\u00e9s par 158 employ\u00e9s [d’abord] de l’Enron Corporation dans les ann\u00e9es pr\u00e9c\u00e9dant l’effondrement de l’entreprise en d\u00e9cembre 2001. Le corpus a \u00e9t\u00e9 g\u00e9n\u00e9r\u00e9 \u00e0 partir de serveurs de courrier \u00e9lectronique Enron par la Federal Energy Regulatory Commission (FERC) lors de son enqu\u00eate ult\u00e9rieure. [2] Une copie de la base de donn\u00e9es des e-mails a ensuite \u00e9t\u00e9 achet\u00e9e pour 10 000 $ par Andrew McCallum, un informaticien de l’Universit\u00e9 du Massachusetts Amherst. [3] Il a publi\u00e9 cette copie \u00e0 des chercheurs, fournissant une trate de donn\u00e9es qui a \u00e9t\u00e9 utilis\u00e9e pour des \u00e9tudes sur les r\u00e9seaux sociaux et la communication m\u00e9di\u00e9e par ordinateur. (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4 Table of ContentsCr\u00e9ation [ modifier ]] Exploitation [ modifier ]] Les r\u00e9f\u00e9rences [ modifier ]] Liens externes [ modifier ]] Cr\u00e9ation [ modifier ]] Dans l’enqu\u00eate juridique sur l’effondrement d’Enron, le processus de d\u00e9couverte a n\u00e9cessit\u00e9 la collecte et la pr\u00e9servation de grandes quantit\u00e9s de donn\u00e9es, pour lesquelles la FERC a embauch\u00e9 Aspen Systems (qui fait maintenant partie de Lockheed Martin). Les e-mails ont \u00e9t\u00e9 recueillis au si\u00e8ge social de l’Enron Corporation \u00e0 Houston pendant deux semaines en mai 2002 par Joe Bartling, [4] Un entrepreneur en mati\u00e8re de support en litige et d’analyse des donn\u00e9es pour Aspen. En plus des e-mails des employ\u00e9s d’Enron, tous les syst\u00e8mes de base de donn\u00e9es d’entreprise d’Enron, [5] H\u00e9berg\u00e9 dans les bases de donn\u00e9es Oracle sur les serveurs Sun Microsystems, ont \u00e9t\u00e9 captur\u00e9s et conserv\u00e9s, y compris sa plate-forme de trading d’\u00e9nergie en ligne, Enrononline. Une fois collect\u00e9s, les e-mails d’Enron ont \u00e9t\u00e9 trait\u00e9s et h\u00e9berg\u00e9s dans des plateformes de d\u00e9couverte \u00e9lectronique propri\u00e9taires (premi\u00e8re concordance, puis iconecte) pour examen par les enqu\u00eateurs de la FERC, Commodity Futures Trading Commission et minist\u00e8re de la Justice. \u00c0 la fin de l’enqu\u00eate et lors de la publication du rapport du personnel de la FERC, [6] Les e-mails et les informations collect\u00e9s ont \u00e9t\u00e9 consid\u00e9r\u00e9s comme dans le domaine public, pour \u00eatre utilis\u00e9s \u00e0 des fins de recherche historique et acad\u00e9mique. Les archives de courrier \u00e9lectronique ont \u00e9t\u00e9 rendues publiques et consultables via le Web \u00e0 l’aide d’Iconect 24\/7, mais le volume d’e-mail de plus de 160 Go l’a rendu peu pratique. Des copies des e-mails et bases de donn\u00e9es collect\u00e9s ont \u00e9t\u00e9 mis \u00e0 disposition sur les disques durs. (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4Jitesh Shetty et Jafar Adibi de l’Universit\u00e9 de Californie du Sud ont trait\u00e9 les donn\u00e9es en 2004 et publi\u00e9 une version MySQL. [7] En 2010, Edrm.net a publi\u00e9 une version 2 r\u00e9vis\u00e9e et \u00e9largie du Corpus, [8] contenant plus de 1,7 million de messages, qui a \u00e9t\u00e9 mis \u00e0 disposition sur Amazon S3 pour un acc\u00e8s facile aux chercheurs. Exploitation [ modifier ]] Une visualisation du r\u00e9seau de messagerie dans l’Enron Corpus, avec une coloration repr\u00e9sentant huit communaut\u00e9s Le corpus est \u00e9valu\u00e9 comme l’une des rares collections de masse accessibles au public de v\u00e9ritables e-mails facilement disponibles pour l’\u00e9tude; Ces collections sont g\u00e9n\u00e9ralement li\u00e9es par de nombreuses restrictions de confidentialit\u00e9 et juridiques qui les rendent prohibitifs \u00e0 acc\u00e9der, tels que les accords de non-divulgation et la d\u00e9sinfection des donn\u00e9es. [3] Shetty et Adibi, bas\u00e9s sur leur version MySQL, ont publi\u00e9 une analyse de liens des comptes d’utilisateurs envoy\u00e9s par e-mail. [9] La comparaison linguistique avec les corpus de courrier \u00e9lectronique plus r\u00e9cents montre des changements dans le registre de messagerie en anglais. Il est \u00e9galement utilis\u00e9 comme donn\u00e9es de test ou de formation pour la recherche en mati\u00e8re de traitement du langage naturel et d’apprentissage automatique. [dix] Les r\u00e9f\u00e9rences [ modifier ]] ^ Klimt, Bryan; Yiming Yang (2004). “The Enron Corpus: un nouvel ensemble de donn\u00e9es pour la recherche de classification des e-mails”: 217-226. Ciseerx 10.1.1.61.1645 . ^ ” Le corpus Enron Email Archiv\u00e9 2011-03-08 sur la machine Wayback “r\u00e9cup\u00e9r\u00e9e le 5 mars 2011. ^ un b Markoff, John. ” Des arm\u00e9es d’avocats co\u00fbteux, remplac\u00e9s par des logiciels moins chers “. New York Times 5 mars 2011. P A1. ^ Bartling, Joe (3 septembre 2015). “L’ensemble de donn\u00e9es Enron – d’o\u00f9 vient-il?” . Bartling Forensic and Advisory . R\u00e9cup\u00e9r\u00e9 3 septembre, 2015 . ^ “FERC: Industries – Les bases de donn\u00e9es et bases de donn\u00e9es de trading d’\u00e9nergie d’Enron” d’Enron ” . www.ferc.gov . R\u00e9cup\u00e9r\u00e9 2015-09-02 . ^ Rapport du personnel de la FERC – Manipulation des prix sur les march\u00e9s occidentaux – R\u00e9sultats en un coup d’\u0153il (3-26-2003) ^ ” Base de donn\u00e9es trait\u00e9e \u00e0 Enron ” ^ Socha, George. “Ensemble de donn\u00e9es par e-mail EDRM ENRON V2 maintenant disponible” . Edrm.net. Archiv\u00e9 de l’original le 2011-09-04 . R\u00e9cup\u00e9r\u00e9 2012-09-03 . ^ Shetty, Jitesh; Adibi, Jafar (2005). “D\u00e9couvrir les n\u0153uds importants via l’entropie du graphique Le cas de la base de donn\u00e9es de messagerie Enron”. Actes du 3e atelier international sur la d\u00e9couverte des liens – LinkKDD ’05 . pp. 74\u201381. deux: 10.1145 \/ 1134271.1134282 . ISBN 978-1595932150 . S2cid 10122735 . ^ Friginal, Eric; Hardy, Jack (2013). Sociolinguistique bas\u00e9e sur les corpus: guide pour les \u00e9tudiants . Routledge. p. 167. ISBN 978-1-13-136-29277-4 . R\u00e9cup\u00e9r\u00e9 29 mai 2020 . Liens externes [ modifier ]] (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4"},{"@context":"http:\/\/schema.org\/","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"https:\/\/wiki.edu.vn\/en2fr\/wiki28\/#breadcrumbitem","name":"Enzyklop\u00e4die"}},{"@type":"ListItem","position":2,"item":{"@id":"https:\/\/wiki.edu.vn\/en2fr\/wiki28\/copus-wikipedia-wikipedia\/#breadcrumbitem","name":"Copus – Wikipedia Wikipedia wiki"}}]}]