osl-pocs · luabida · Jun 8, 2022 · Jun 14, 2022 · Jun 14, 2022 · Jun 16, 2022
diff --git a/.gitignore b/.gitignore
@@ -1,2 +1,4 @@
 *.env*
 __pycache__
+.vscode/
+data_test/
-data_test/
+tests/data
-data_test/
+tests/data
diff --git a/Makefile b/Makefile
@@ -0,0 +1,5 @@
+.ONESHELL:
+
+.PHONY:ttrack-db
+ttrack-db:
-ttrack-db:
+dev-dump-ttrack-db:
-ttrack-db:
+dev-dump-ttrack-db:
+	cp ~/.timetrackdb data/.timetrackdb
diff --git a/README.md b/README.md
@@ -24,7 +24,18 @@ Example:
 ```bash
 python invoicex/main.py \
   --year-month 2022-04 \
-  --gh-user xmnlab \
+  --gh-user $USER \
   --gh-org osl-incubator/invoicex \
   --timezone "-0400"
 ```
+## Integrating TTrack
+
+1) Run:
+```bash
+make ttrack-db
+```
+
+2) Add tasks to the report:
+```
+--ttrack-task foo --ttrack-task bar
+```
diff --git a/invoicex/main.py b/invoicex/main.py
@@ -5,8 +5,9 @@
 import os
 import time
 
-import reader
+import invoicex.reader.github as github
-import invoicex.reader.github as github
+from invoicex.reader import ComposeReader
-import invoicex.reader.github as github
+from invoicex.reader import ComposeReader
 import report
+import invoicex.reader.ttrack as ttrack
-import invoicex.reader.ttrack as ttrack
-import invoicex.reader.ttrack as ttrack
 
 
 def cli_parser():
@@ -59,7 +60,7 @@ def cli_parser():
         action="store",
         type=str,
         default=time.strftime("%z"),
-        help="The GitHub access token.",
+        help="The invoice timezone",
     )
     # TODO: add option for custom output dir
     """
@@ -72,14 +73,23 @@ def cli_parser():
         help="The output directory for the reports (default: /tmp)",
     )
     """
+    parser.add_argument(
+        "--ttrack-task",
+        dest="ttrack_task",
+        action="append",
+        required=False,
+        default=[],
+        help="Task name from TTrack",
+    )
 
     return parser
 
 
 async def main():
     args = cli_parser().parse_args()
-    results = await reader.get_data(args)
-    await report.generate(results, args)
+    results = await ttrack.get_data(args)
+    print(results)
+    # await report.generate(results, args)
 
 
 if __name__ == "__main__":

diff --git a/invoicex/reader/__init__.py b/invoicex/reader/__init__.py
diff --git a/invoicex/reader/compose.py b/invoicex/reader/compose.py
@@ -0,0 +1,2 @@
+class ComposeReader:
+    """github + ttrack -> DF"""
diff --git a/invoicex/reader.py → invoicex/reader/github.py b/invoicex/reader.py → invoicex/reader/github.py
diff --git a/invoicex/reader/ttrack.py b/invoicex/reader/ttrack.py
@@ -0,0 +1,103 @@
+from asyncio import tasks
+import sqlite3
+from typing import Any
+import pandas as pd
+import datetime as dt
+
+TTRACK_DB = "data/.timetrackdb"
+
+class TTrack:
+    def __init__(self, timetrackdb_file, parameters):
+        self.timetrackdb = timetrackdb_file
+        self.year_month = parameters.year_month
+        self.tasks = parameters.ttrack_task        
+
+    async def _conn_point(self):
+        """Connect and point to .timetrackdb SQLite DB"""
+        conn = sqlite3.connect(TTRACK_DB)
+        cur = conn.cursor()
+        return cur
+
+    async def _get_query(self, task):
+        """Do the query defined by --ttrack_task"""
+        if len(task) > 1:
+            tasks_text = ", ".join([f'"{v}"' for v in task])
+        else:
+            tasks_text = f'"{task[0]}"'
+        return (
+            "SELECT name, start, end FROM tasks AS T"
+            " INNER JOIN tasklog AS L ON T.id=L.task"
+            f' WHERE name IN ({tasks_text})'
+            " ORDER BY start"
+        )
+
+    async def _execute_query(self):
+        """Execute the query and returns a list cointaining""" 
+        """tasks with time in timestamp format"""
+        cur = await self._conn_point()
+        entries_in_timestamp = []
+        for row in cur.execute(
+            await self._get_query(self.tasks)  # TODO Except type error or use regex
+        ):
+            entries_in_timestamp.append(row)
+        return entries_in_timestamp
+
+    async def _format_date(self):
+        """Format timestamp date to datetime objects"""
+        entries = await self._execute_query()
+        list_of_entries_with_formated_date = []
+
+        for task, start, end in entries:
+            start_f = dt.datetime.fromtimestamp(start)
+            end_f = dt.datetime.fromtimestamp(end)
+            list_of_entries_with_formated_date.append([task, start_f, end_f])
+        return list_of_entries_with_formated_date
+
+    async def _prepare_dataframe(self):
+        """Get the result and transform in a Pandas DataFrame"""
+        raw_data = await self._format_date()
+        data = []
+        for task, start, end in raw_data:
+            time_worked = end - start
+            task_dict = {
+                "task": task,
+                "date": start.strftime("%Y-%m-%d"),
+                "time_worked": time_worked,
+            }
+            data.append(task_dict)
+        df = pd.DataFrame(data=data).sort_values(["date"])
+        return df
+
+    async def _filter_by_month(self, year_month=None):
+        """Month is defined along with the Invoicex generation"""
+        df = await self._prepare_dataframe()
+        if year_month is None:
+            return df
+        else:
+            return df[df["date"].str.startswith(str(year_month))]
+
+    def _group_tasks_remove_duplicates(self, v):
+        tasks = v.to_string(index=False).split()
+        unique_tasks = set(tasks)
+        for t in unique_tasks:
+            return ", ".join(str(t) for t in unique_tasks)
+
+    def _group_time_and_sum(self, v):
+        return v.sum()
+
+    async def _generate_dataframe(self):
+        """Create the final DataFrame"""
+        df = await self._filter_by_month(self.year_month)
+        df_grouped = df.groupby("date").aggregate(
+            lambda v: self._group_tasks_remove_duplicates(v)
+            if v.name == "task"
+            else self._group_time_and_sum(v)
+        )
+        return df_grouped
+
+
+async def get_data(args) -> pd.DataFrame:
+    """ """
+    database = TTRACK_DB
+    ttrack_df = TTrack(database, args)
+    return await ttrack_df._generate_dataframe()