Skip to content

Przetwarzanie danych do plików csv

JoelSalzesson edited this page Jun 27, 2018 · 4 revisions
  1. Po sklonowaniu repo przejdź do folderu /rawData/.
  2. Zmień wszystkie pliki .doc do .docx (z niestotnego powodu pliki .doc nie są dobrze obsługiwane przez użyty poniżej skrypt; procedura zmiany .doc do .docx musi się odbyć za pomocą narzędzia spoza niniejszego repo).
  3. Wykonaj komendę python transformAllFiles.py ../transformedData/.
  4. Skrypt transformuje wszystkie napotkane pliki .docx i .odt do plików .csv.

Specyfikacja czym jest plik csv znajduje się tutaj i tutaj.

Clone this wiki locally