Skip to content

Commit

Permalink
DataLinux intro slides aangepast voor 23-24
Browse files Browse the repository at this point in the history
  • Loading branch information
bertvv committed Sep 19, 2023
1 parent 7103ef4 commit 09417e9
Show file tree
Hide file tree
Showing 3 changed files with 171 additions and 106 deletions.
171 changes: 171 additions & 0 deletions 00-datalinux-intro.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,171 @@
---
title: "0. Linux for Data Scientists: intro"
subtitle: "HOGENT toegepaste informatica"
author: Thomas Parmentier, Andy Van Maele, Bert Van Vreckem
date: 2023-2024
---

# Studiewijzer

## Lectoren

- Thomas Parmentier (Gent)
- Bert Van Vreckem (titularis, Aalst+VC, TIAO)

Contactinfo - zie verder/studiewijzer

# Plaats in het curriculum

![Overzicht gerelateerde vakken](assets/datalinux-curriculum.png)

## Waarom Linux?

## Linux is overal

... en je kan er gewoon niet meer omheen

- Grootste websites
- webapps draaien meestal op Linux
- ook .Net (meer en meer)!
- MacOS X
- Ook UNIX (BSD)
- Bash-shell + commando's

---

- Moderne tools voor software release management
- Continuous Integration/Delivery
- Docker
- Embedded systemen
- Arduino, Raspberry Pi, ...
- Multimedia-apparatuur, TV's, NAS, ...

---

![Automate all the things!](assets/automate.jpg)

---

- Toolbox voor automatisering
- Filtercommando's
- `grep`/`ag`, `sed`, `awk`
- `curl`, `jq`, `pandoc`, ...
- Shell scripts
- Configuration Management Systems (Ansible, ...)

## Ook in de Windows-wereld

- Azure cloud platform draait >50% Linux VMs
- Microsoft loves Linux!

---

> The '70's called, they want their terminal back!
## De kracht van de CLI

- Command line interface (CLI) is de sleutel tot **automatisering**
- Miljoenen servers beheren gaat niet via GUI
- Ook in Windows ziet men dit nu in (PowerShell)
- CLI Instructies zijn **bondiger** en makkelijker reproduceerbaar dan GUI instructies

## Waarom Linux for Data Scientists?

- Je hebt niet altijd een commerciële oplossing nodig voor data processing!
- Linux zit vol krachtige tools waarmee je zelf een oplossing kan bouwen
- Linux + Docker + Python = basisplatform voor Data Engineers

# Leerinhoud

## Topics

- Werken met Virtuele Machines & containers
- Basiskennis Linux server, SSH, software-installatie, web-/database-serverconfiguratie
- Bash scripting
- Text processing: I/O redirection, filters, web scraping
- Systeembeheertaken plannen
- Automatiseren van gegevensverwerking met Linux tools

# Leerdoelen: zie studiewijzer/studiefiche

# Leermateriaal

## Leermateriaal op Chamilo

- Leerpad
- Cobbaut (2015) *Linux Fundamentals*
- Labo-opgave (Github-repo)

## Software

- Git client (incl Git Bash)
- Teksteditor, bv. VS Code met (aanbevolen) plugins:
- Remote Development
- ShellCheck
- Oracle VirtualBox + Extension Pack
- Linux Mint als GUI-Linux VM
- Download ova file
- import & get started

# Werkvormen

## Dagonderwijs, virtuele campus

- 3 lesuur / week
- 4 studiepunten
- equivalente hoeveelheid voor- en nawerk thuis

## Verloop contactmoment

- Klassikale instructie
- Werken aan labo-oefeningen
- individuele feedback
- extra klassikale uitleg
- Korte intro volgende sessie

## Buiten contactmomenten

- Bereid volgende sessie voor
- Leerpad: voorbereiding, achtergrondinfo, oefeningen met oplossingen
- Werk verder aan labo's

## Afstandsleren (TIAO)

- Op eigen tempo, ahv studiemateriaal
- Zie ook Studiewijzer - Studiebegeleiding

# Werk- en leeraanwijzingen

## Leerpad: per hoofdstuk

- **Voorbereiding**: vóór het contactmoment
- **Achtergrondinfo**: interessant, maar geen leerstof
- **Oefeningen met oplossingen**: buiten contactmomenten
- **Labo-oefeningen**: tijdens/buiten contactmomenten

## Tips voor slagen

- Kom naar de les!
- Lees de studiewijzer!
- Maak de labo's!

# Evaluatie

- 70% Vaardigheidstest binnen examenrooster
- 30% Schriftelijk examen (op PC)
- 40% Scripting-opdracht (op PC)
- 30% Portfolio met mondelinge verdediging
- Opdracht: automatiseren van een data-workflow

# Studiebegeleiding

## Heb je een vraag?

1. Stel ze tijdens de contactmomenten
2. Stel ze via Teams (cursusintro, rechtertegel)
3. Contacteer jouw lector
- Enkel voor persoonlijke/vertrouwelijke zaken!

# Planning: zie studiewijzer

# Veel succes!
106 changes: 0 additions & 106 deletions 00-linux-ds-intro.md

This file was deleted.

Binary file added assets/datalinux-curriculum.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.

0 comments on commit 09417e9

Please sign in to comment.