Pædagogisk data mining

Pædagogisk Data Mining beskriver et forskningsområde beskæftiger sig med anvendelsen af ​​data mining, maskine læring og statistik til oplysninger, der genereres fra undervisningsmiljøer. På et højt niveau, søger feltet for at udvikle og forbedre metoder til at udforske disse data, som ofte har flere niveauer af meningsfuld hierarki, med henblik på at opdage nye indsigter om, hvordan mennesker lærer i forbindelse med sådanne indstillinger. Dermed har EDM bidraget til teorier om læring undersøgt af forskere i pædagogisk psykologi og læring videnskaber. Feltet er tæt forbundet med den for læring analytics, og de to er blevet sammenlignet og kontrast.

Definition

Pædagogisk Data Mining refererer til teknikker, værktøjer og forskning designet til automatisk at udtrække mening fra store lagre af data genereret af eller relateret til folks læringsaktiviteter i undervisningsmiljøer. Ganske ofte, disse data er omfattende, finkornet, og præcis. For eksempel flere learning management systemer spore oplysninger såsom når hver elev adgang hver lærer objekt, hvor mange gange de tilgås det, og hvor mange minutter at lære objekt blev vist på brugerens computer skærm. Som et andet eksempel intelligente tutoring systemer registrere data hver gang en elev forelægger en løsning på et problem; de kan indsamle tidspunktet for indsendelse, hvorvidt løsningen matcher den forventede løsning, den tid, der er gået siden sidste indsendelse, i hvilken rækkefølge løsningskomponenter indgået grænsefladen osv Præcisionen af ​​denne data er sådan, at selv en forholdsvis kort session med en computerbaseret læringsmiljø kan producere en stor mængde procesdata til analyse.

I andre tilfælde, at data er mindre finkornet. For eksempel kan en studerendes universitet udskrift indeholde en tidsmæssigt ordnet liste af kurser, der træffes af den studerende, den lønklasse, at den studerende optjent i hvert kursus, og når den studerende valgte eller ændrede hans eller hendes akademiske større. EDM udnytter begge typer af data, til at opdage meningsfulde oplysninger om forskellige typer af elever, og hvordan de lærer, struktur domænet viden og effekten af ​​undervisningsstrategier indlejret i forskellige læringsmiljøer. Disse analyser giver nye oplysninger, der ville være vanskeligt at skelne ved at se på de rå data. For eksempel kan analysere data fra en LMS afslører en sammenhæng mellem de læringsobjekter, at en studerende adgang løbet og deres endelige kursus lønklasse. På samme måde kan analysere studerende udskrift data afslører et forhold mellem en elevs klasse i et bestemt kursus, og deres beslutning om at ændre deres akademiske større. Sådanne oplysninger giver indsigt i design af læringsmiljøer, som giver studerende, lærere, skoleledere og pædagogiske politiske beslutningstagere til at træffe informerede beslutninger om, hvordan at interagere med, give og administrere uddannelsesmæssige ressourcer.

Historie

Mens analysen af ​​uddannelsesmæssige data er ikke i sig selv en ny praksis, seneste fremskridt inden for undervisningsteknologi, herunder stigningen i computerkraft og evnen til at logge finkornet data om elevernes brug af en computer-baseret læringsmiljø, har ført til en øget interesse i at udvikle teknikker til at analysere de store mængder data, der genereres i undervisningsmiljøer. Denne interesse oversat til en række EDM workshopper afholdt fra 2000-2007 som en del af en række internationale forskningsprojekter konferencer. I 2008 en gruppe forskere etableret hvad der er blevet en årlig international forskning konference om EDM, hvoraf den første fandt sted i Montreal, Canada.

Som interesse i EDM fortsatte med at stige, EDM forskere etableret et akademisk tidsskrift i 2009, Journal of Educational Data Mining, til deling og formidling af forskningsresultater. I 2011 EDM forskere etablerede International Educational Data Mining Society til at forbinde EDM forskere og fortsætte med at vokse feltet.

Med indførelsen af ​​offentlige uddannelsesinstitutioner datalagre i 2008, såsom Pittsburgh Science for Læring centrets Datashop og National Center for Education Statistics, har de offentlige datasæt gjort uddannelsesmæssige data mining mere tilgængelige og muligt, bidrage til dets vækst.

Mål

Baker og Yacef identificeret følgende fire mål i EDM:

  • Forudsigelse studerendes fremtidige adfærd læring - Med brug af studerendes modellering, kan dette mål nås ved at skabe de studerendes modeller, der inkorporerer elevens karakteristika, herunder detaljerede oplysninger såsom deres viden, adfærd og motivation til at lære. Brugeren oplevelse af den lærende og deres generelle tilfredshed med læring måles også.
  • Opdage eller forbedre domæne-modeller - Gennem de forskellige metoder og anvendelser af EDM, opdagelsen af ​​nye og forbedringer af eksisterende modeller er mulig. Eksempler omfatter illustrerer det pædagogiske indhold til at engagere eleverne og bestemme optimale instruktions sekvenser til at understøtte den studerendes læringsstil.
  • At studere effekterne af pædagogisk støtte, der kan opnås gennem læringssystemer.
  • Fremme videnskabelig viden om læring og elever ved at bygge og indarbejde de studerendes modeller, inden for EDM forskning og teknologi og software, der anvendes.

Brugere og Interessenter

Der er fire vigtigste brugere og interessenter, der er involveret med pædagogisk data mining. Heriblandt:

  • Lærende - lærende er interesseret i at forstå de studerendes behov og metoder til at forbedre elevens erfaring og ydeevne. For eksempel kan eleverne også drage fordel af den opdagede viden ved hjælp af EDM værktøjer til at foreslå aktiviteter og ressourcer, som de kan bruge baseret på deres interaktion med online-læringsværktøj og indsigt fra tidligere eller lignende elever. For yngre elever, kan pædagogisk data mining også oplyse forældrene om deres barns læring fremskridt. Det er også nødvendigt for effektivt gruppe elever i et online-miljø. Udfordringen er at lære disse grupper baseret på de komplekse data samt udvikle handlingsrettede modeller til at fortolke disse grupper.
  • Undervisere - Undervisere forsøge at forstå læringsprocessen og de metoder, de kan bruge til at forbedre deres undervisningsmetoder. Undervisere kan bruge anvendelser af EDM at bestemme, hvordan man organiserer og strukturerer pensum, de bedste metoder til at levere kurset oplysninger og værktøjer til at bruge til at engagere deres elever for optimal læringsresultater. Især destillation af data til menneskelig dom teknik giver mulighed for undervisere til at drage fordel af EDM fordi det giver undervisere til hurtigt at identificere adfærdsmønstre, som kan understøtte deres undervisningsmetoder i løbet af kurset, eller for at forbedre fremtidige kurser. Undervisere kan bestemme indikatorer, der viser studerendes tilfredshed og engagement kursusmateriale, og også overvåge læring fremskridt.
  • Forskere - Forskere fokusere på udvikling og evaluering af data mining teknikker til effektivitet. En årlig international konference for forskere begyndte i 2008, efterfulgt af etableringen af ​​Journal of Educational Data Mining i 2009. bred vifte af emner i EDM spænder fra at bruge data mining til at forbedre den institutionelle effektivitet til elevernes resultater.
  • Administratorer - Administratorer er ansvarlige for tildeling af ressourcer til implementering i institutionerne. Som institutioner i stigende grad ansvarlig for studerende succes, er indgift af EDM-applikationer bliver mere almindelig i undervisningsmiljøer. Fakultetet og rådgivere bliver mere proaktive i at identificere og imødegå udsatte elever. Men det er nogle gange en udfordring at få de oplysninger til beslutningstagerne til at administrere programmet på en rettidig og effektiv måde.

Faser i Pædagogisk Data Mining

Som forskning inden for pædagogisk data mining er fortsat med at vokse, har et utal af data mining teknikker blevet anvendt på en række forskellige uddannelsesmæssige sammenhænge. I hvert tilfælde er målet at omsætte rå data til meningsfuld information om læreprocessen for at træffe bedre beslutninger om design og bane af et læringsmiljø. Således EDM generelt består af fire faser:

  • Den første fase af EDM-processen er at opdage relationer i data. Dette indebærer at søge gennem et lager af data fra et pædagogisk miljø med det mål at finde konsistente relationer mellem variabler. Adskillige algoritmer til at identificere sådanne relationer er blevet udnyttet, herunder klassificering, regression, klyngedannelse, faktoranalyse, social netværksanalyse, forening regel minedrift, og sekventiel mønster minedrift.
  • Opdagede relationer skal derefter valideres for at undgå overfitting.
  • Validerede relationer anvendes til at gøre forudsigelser om fremtidige begivenheder i læringsmiljøet.
  • Forudsigelser er vant til at understøtte beslutningsprocesser og politiske beslutninger.

Under fase 3 og 4, bliver data ofte visualiseres eller på anden måde destilleret for menneskelig vurdering. En stor mængde forskning er blevet udført i bedste praksis til visualisering af data.

Vigtigste Approaches

Af de generelle kategorier af metoder, der er nævnt, er forudsigelse, klyngedannelse og forholdet minedrift betragtes universelle metoder på tværs af alle typer af data mining; Men Discovery med modeller og Destillation af data for human dom betragtes som mere fremtrædende tilgange inden pædagogisk data mining.

Discovery med Modeller

I Discovery med model-metoden, er en model udviklet via forudsigelse, klyngedannelse eller ved menneskelig ræsonnement viden teknik og derefter brugt som en komponent i en anden analyse, nemlig forudsigelse og forholdet minedrift. I forudsigelse metode anvendes, er den oprettede modellens forudsigelser bruges til at forudsige en ny variabel. For anvendelse af forholdet minedrift, den skabte model muliggør analysen mellem nye forudsigelser og yderligere variabler i undersøgelsen. I mange tilfælde, opdagelse med modeller anvender validerede forudsigelsesmodeller, der har vist generaliserbarhed på tværs sammenhænge.

Vigtigste anvendelser af denne metode omfatter Discovering relationer mellem studerende adfærd, karakteristika og kontekstuelle variabler i læringsmiljøet. Yderligere opdagelse af brede og specifikke forskningsspørgsmål på tværs af en bred vifte af sammenhænge kan også udforskes ved hjælp af denne metode.

Destillation af data for human dom

Mennesker kan drage slutninger om data, der kan være uden for rammerne, hvor en automatiseret data mining metode giver. Til brug for uddannelse af data mining, data destilleres til human dom til to vigtige formål, identifikation og klassificering.

Med henblik på identifikation, er data destilleret for at gøre det muligt for mennesker at identificere kendte mønstre, som ellers kan være vanskeligt at fortolke. For eksempel indlæringskurve, klassiske til pædagogiske studier, er et mønster, der klart afspejler forholdet mellem læring og erfaring over tid.

Data også destilleret med henblik på at klassificere funktioner i data, som for pædagogisk datamining, bruges til at støtte udviklingen af ​​forudsigelsen model. Klassificering hjælper fremskynde udviklingen af ​​forudsigelsesmodel, voldsomt.

Målet med denne metode er at sammenfatte og præsentere oplysningerne i en nyttig, interaktiv og visuelt tiltrækkende måde for at forstå de store mængder uddannelse data og til at støtte beslutningstagning. Især denne fremgangsmåde er til gavn for lærere at forstå brugsoplysninger og effektivitet i kursusaktiviteter. Vigtige applikationer til destillation af data for menneskelig vurdering inkluderer identificere mønstre i de studerendes læring, adfærd, muligheder for samarbejde og mærkning af data til fremtidige anvendelser i forudsigelsesmodeller.

Applikationer

En liste over de primære anvendelser af EDM leveres af Cristobal Romero og Sebastian Ventura. I deres taksonomi, områderne EDM program er:

  • Analyse og visualisering af data
  • Give feedback til at understøtte instruktører
  • Anbefalinger til studerende
  • Forudsigelse studerendes præstation
  • Student modellering
  • Afsløring uønskede studerende adfærd
  • Gruppering studerende
  • Social netværksanalyse
  • Udvikling koncept maps
  • Konstruktion kursusmateriale - kan EDM anvendes på kursus management systemer såsom open source Moodle. Moodle indeholder brugsdata, der omfatter forskellige aktiviteter fra brugere som testresultater, mængden af ​​aflæsninger afsluttet og deltagelse i diskussionsfora. Data mining-værktøjer kan bruges til at tilpasse læringsaktiviteter for hver bruger og tilpasse tempoet, hvor den studerende afslutter kurset. Dette er i særlig gavnligt for online kurser med varierende niveauer af kompetence.
  • Planlægning og planlægning

Ny forskning på mobile læringsmiljøer tyder også på, at data mining kan være nyttig. Data mining kan bruges til at hjælpe med at give personligt indhold til mobile brugere, trods forskellene i forvaltningen indhold mellem mobile enheder og standard pc'er og web-browsere.

Nye EDM applikationer vil fokusere på at tillade ikke-tekniske brugere bruge og engagere sig i data mining værktøjer og aktiviteter, hvilket gør dataindsamling og -behandling mere tilgængelige for alle brugere af EDM. Eksempler omfatter statistiske og visualisering værktøjer, der analyserer sociale netværk og deres indflydelse på læringsresultater og produktivitet.

Kurser

I oktober 2013 coursera tilbudt en gratis online kursus om "Big Data Education", der lærer, hvordan og hvornår man skal bruge de vigtigste metoder til EDM. Et kursus arkivet er nu tilgængelige online.

Lærere College, Columbia University tilbyder en Learning Analytics fokus som en del af sine Kognitive Studies Masters.

Offentliggørelse Spillesteder

Betydelige mængder af EDM arbejde offentliggøres i peer-reviewed internationale konference om Educational Data Mining, arrangeret af International Educational Data Mining Society.

  • 1st internationale konference om Educational Data Mining - Montreal, Canada
  • 2. internationale konference om Educational Data Mining - Cordoba, Spanien
  • 3. internationale konference om Educational Data Mining - Pittsburgh, USA
  • 4. internationale konference om Educational Data Mining - Eindhoven, Holland
  • 5. internationale konference om Educational Data Mining - Chania, Grækenland
  • 6. internationale konference om Educational Data Mining - Memphis, USA

EDM papirer er også offentliggjort i Journal of Educational Data Mining.

Mange EDM papirer rutinemæssigt offentliggjort i relaterede konferencer, såsom kunstig intelligens og uddannelse, Intelligent Tutoring Systems, og Bruger Modellering og Adaptive Personlige indstillinger.

I 2011 Chapman & amp; Reception / CRC Press, Taylor og Francis Group offentliggjorde den første Handbook of Educational Data Mining. Denne ressource blev skabt for dem, der er interesserede i at deltage i den pædagogiske data mining samfund.

Konkurrencer

I 2010 blev Association for Computing Machinery s KDD Cup udført ved hjælp af data fra en uddannelsesmæssig indstilling. Datasættet blev leveret af Pittsburgh Science for Læring Centers Datashop, og den bestod af over 1.000.000 datapunkter fra de studerende ved hjælp af en kognitiv Tutor. Seks hundrede hold konkurrerede om over 8.000 USD i præmiepenge. Målet for deltagerne var at designe en algoritme, der, efter at lære fra de leverede data, ville gøre de mest præcise forudsigelser fra nye data. Vinderne indsendt en algoritme, der udnyttede funktion generation, tilfældige skove, og Bayesianske netværk.

Omkostninger og udfordringer

Sammen med teknologiske fremskridt er omkostninger og udfordringer forbundet med at implementere EDM-applikationer. Disse omfatter de omkostninger, til at gemme loggede data og omkostningerne forbundet med ansættelse af personale dedikeret til at styre datasystemer. Desuden kan datasystemer ikke altid integreres problemfrit med hinanden, og selv med støtte fra statistiske og visualiseringsværktøjer, skaber en forenklet version af dataene kan være svært. Desuden kan vælge, hvilke data til mine og analysere også være udfordrende, hvilket gør de indledende faser meget tidskrævende og arbejdskraftintensive. Fra start til slut, EDM strategi og gennemførelse kræver en til at opretholde privatlivets fred og etik for alle involverede parter.

Kritik

  • Generaliserbarhed - Forskning i EDM kan være specifikke for særlige pædagogiske indstilling og tid, hvor forskningen blev gennemført, og som sådan ikke kan være generaliseres til andre institutioner. Forskning viser også, at området for pædagogisk data mining er koncentreret i Nordamerika og vestlige kulturer og senere, kan andre lande og kulturer ikke være repræsenteret i forskning og resultater. Udvikling af fremtidige modeller skal behandle ansøgninger på tværs af flere kontekster.
  • Fortrolighed - Individuel privatlivets fred er en fortsat bekymring for anvendelsen af ​​data mining-værktøjer. Med gratis, tilgængelige og brugervenlige værktøjer på markedet, kan eleverne og deres familier være i fare fra de oplysninger, som eleverne giver til læring systemet, i håb at modtage feedback, der vil gavne deres fremtidige præstationer. Som brugere bliver kyndige i deres forståelse af online privatliv, administratorer af pædagogiske data mining-værktøjer er nødt til at være proaktive i at beskytte privatlivets fred for deres brugere og være åbne om, hvordan og med hvem oplysningerne vil blive brugt og delt. Udvikling af EDM værktøjer bør overveje at beskytte privatlivets fred, mens du stadig at fremme forskningen på dette område.
  • Plagiat - Plagiat afsløring er en vedvarende udfordring for pædagoger og fakultet, om i klasseværelset eller online. Men på grund af de komplekse forbundet med at opdage og forebygge digital plagiat i særdeleshed, uddannelsesmæssige data mining værktøjer er i øjeblikket ikke sofistikerede nok til præcist løse dette problem. Således bør udviklingen af ​​prognosemuligheder i plagiat emner være et fokusområde i fremtidig forskning.
  • Adoption - Det er uvist, hvor udbredt vedtagelsen af ​​EDM er, og i hvilket omfang institutionerne har anvendt og overvejet at gennemføre en EDM-strategi. Som sådan, er det uklart, om der er barrierer, der forhindrer brugere fra at vedtage EDM i deres uddannelsesmæssige indstillinger.
  0   0
Forrige artikel Chiron Corporation

Kommentarer - 0

Ingen kommentar

Tilføj en kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tegn tilbage: 3000
captcha