Tech stack¶
Core AI/ML Stack¶
| Technologie | Versie | Rol | Voordelen |
|---|---|---|---|
| PyTorch | 2.7.0 | Deep learning framework | - Flexibele modelarchitectuur; - Dynamische computation graphs; - Sterke community support; - Eenvoudige model serialisatie (.pth) |
| MediaPipe | 0.10.21 | Computer vision + keypoint extraction | • Real-time performance; • Pre-trained hand detection; • Robuuste landmark tracking; • Cross-platform support |
| NumPy | 1.26.4 | Numerieke operaties | Efficiënte array-operaties; Basis voor PyTorch tensors; Data preprocessing |
| OpenCV (cv2) | 4.11.0.86 | Image processing | Image decoding (JPEG/PNG); Color space conversies (BGR↔RGB); Basis image manipulatie |
| Pandas | 2.3.3 | Data handling (training) | Dataset management; CSV/JSON I/O; Data augmentatie |
Package Management¶
Het smart_gestures package:
- Structuur: Hierarchische module-organisatie
- Distributie: PyPI package (smart_gestures)
- Versioning: Semantic versioning
- Dependencies: Gedeclareerd in
pyproject.toml
Model Serialisatie¶
PyTorch .pth formaat:
- Voordelen:
- Native PyTorch format
- Inclusief
state_dict(model weights) - Klein bestandsformaat (5-20 MB per model)
- Makkelijk laden met
torch.load() - Locatie:
models/directories binnen elk model-subpackage
Waarom deze technologieën?¶
PyTorch¶
PyTorch biedt de flexibiliteit voor het ontwikkelen van custom LSTM-architecturen met eenvoudige debugging-mogelijkheden. Het framework is research-vriendelijk en maakt snel prototypen en experimenteren mogelijk, terwijl het tegelijkertijd production-ready is met goede performance en mogelijkheden voor mobile deployment.
MediaPipe¶
MediaPipe is gekozen vanwege zijn snelheid, geoptimaliseerd voor real-time verwerking met meer dan 60 FPS, en state-of-the-art accuratesse in hand tracking. De eenvoudige API maakt integratie in het project straightforward.