Modules/Regexp-0

Uit basis
Naar navigatie springen Naar zoeken springen

Inleiding

Deze module gaat over reguliere expressies. Als je nog niets over reguliere expressies weet, dan is de Wikipedia-entry een goed (en erg uitgebreide) inleiding. Je gebruikt reguliere expressies vaak als je data in tekst-formaat moet verwerken tot data met meer structuur, bijvoorbeeld in tabel-formaat (CSV, e.d.). Het is één van de gereedschappen voor "Data Science" - maar ook voor veel andere toepassingen.

Deze module bestaat uit de volgende onderdelen:

  • een kennismaking met reguliere expressies
  • een tutorial
  • oefeningen
  • een demonstratie van je kunnen - in een praktisch programma.

Je moet (op je wiki-pagina met uitwerkingen) beknopt verslag doen van wat je gedaan hebt. Deze wiki-pagina moet ook (i) een link bevatten naar het bestand met de source-code van het programma dat je gemaakt hebt, en (ii) bijbehorende voorbeeld-invoer en uitvoer.

Je moet je docent/begeleider kunnen laten zien dat je deze stof beheerst.

Gebruik van reguliere expressies

Reguliere expressies worden op veel verschillende manieren gebruikt. Het doel van deze opdracht is om te verkennen waar reguliere expressies zinvol toegepast kunnen worden.

Hints:

  • Wikipedia-entry
  • Zoeken op Google
  • Inleiding van een tutorial

Opdracht: geef 5 verschillende voorbeelden van het gebruik van reguliere expressies. Tenminste 2 hiervan moeten niet-triviale reguliere expressies zijn, afkomstig zijn uit een niet-triviaal programma op GitHub.

Tutorial

Verwerk de stof van één van de tutorials die hieronder vermeld staat.

P.S. geef aan welk(e) tutorial(s) je gebruikt hebt, en wat je daar goed en eventueel minder goed aan vond. Geef ook aan hoeveel tijd je daaraan besteed hebt. Als je een specifiek onderdeel lastig vond, geef dat dan aan in je verslag.

Oefeningen

Sommige van deze tutorials bevatten ook grotere oefeningen, zie bijvoorbeeld:

Werk

Demonstratie

Maak een programma (in Python of in JavaScript) waarin je reguliere expressions op een zinvolle en niet-triviale manier gebruikt. Je kunt bijvoorbeeld denken aan:

  • het verwerken van een logfile (bijv. van een webserver): omzetten van logfile in een bestand met meer structuur, bijv. in CSV formaat
  • het valideren van input, bijvoorbeeld van een datum, telefoonnummer, enz.

Links

Eigenschappen

  • voorkennis: Git-0 (gebruik van GitHub); Python of JavaScript-programmeren;