GeneralizedNotationNotation/src/analysis/trace_analysis.py at main · ActiveInferenceInstitute/GeneralizedNotationNotation · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
#!/usr/bin/env python3
"""
Trace Analysis Sub-module

Framework-agnostic analysis of simulation traces, free energy dynamics,
policy convergence, state distributions, and cross-framework comparison.

Extracted from post_simulation.py for maintainability.
"""

import logging
from typing import Any, Dict, List

import numpy as np

logger = logging.getLogger(__name__)


def analyze_simulation_traces(
    traces: List[Any], framework: str, model_name: str
) -> Dict[str, Any]:
    """
    Analyze simulation traces (state/observation/action trajectories).

    Args:
        traces: List of trace data (format depends on framework)
        framework: Framework name
        model_name: Model name

    Returns:
        Dictionary with trace analysis results
    """
    try:
        analysis: dict[str, Any] = {
            "framework": framework,
            "model_name": model_name,
            "trace_count": len(traces),
            "trace_lengths": [],
            "state_entropy": [],
            "observation_diversity": [],
            "action_distribution": {},
            "convergence_metrics": {},
        }

        if not traces:
            return analysis

        # Extract trace lengths
        for trace in traces:
            if isinstance(trace, (list, tuple)):
                analysis["trace_lengths"].append(len(trace))
            elif isinstance(trace, dict):
                analysis["trace_lengths"].append(len(trace.get("states", [])))

        # Calculate statistics
        if analysis["trace_lengths"]:
            analysis["avg_trace_length"] = np.mean(analysis["trace_lengths"])
            analysis["max_trace_length"] = np.max(analysis["trace_lengths"])
            analysis["min_trace_length"] = np.min(analysis["trace_lengths"])

        return analysis

    except Exception as e:
        logger.error(f"Error analyzing simulation traces: {e}")
        return {"framework": framework, "model_name": model_name, "error": str(e)}


def analyze_free_energy(
    free_energy_values: List[float], framework: str, model_name: str
) -> Dict[str, Any]:
    """
    Analyze free energy dynamics.

    Args:
        free_energy_values: List of free energy values over time
        framework: Framework name
        model_name: Model name

    Returns:
        Dictionary with free energy analysis results
    """
    try:
        analysis: dict[str, Any] = {
            "framework": framework,
            "model_name": model_name,
            "free_energy_count": len(free_energy_values),
            "free_energy_values": free_energy_values,
        }

        if not free_energy_values:
            return analysis

        # Safely convert free energy values to a flat 1-D array of scalars.
        # Values may be nested lists, multi-dimensional arrays, or ragged
        # sequences — flatten everything and reduce each element to a scalar
        # via np.mean() so that downstream float() calls never fail.
        raw: list[Any] = []
        for val in free_energy_values:
            try:
                arr = np.asarray(val, dtype=float)
                raw.append(float(np.mean(arr)))  # reduce to scalar
            except (TypeError, ValueError) as e:
                logger.debug("Skipping non-numeric free energy entry: %s", e)
                continue
        if not raw:
            return analysis

        fe_array = np.array(raw, dtype=float)

        # Calculate statistics
        analysis["mean_free_energy"] = float(np.mean(fe_array))
        analysis["std_free_energy"] = float(np.std(fe_array))
        analysis["min_free_energy"] = float(np.min(fe_array))
        analysis["max_free_energy"] = float(np.max(fe_array))

        # Calculate trend (decreasing = good for Active Inference)
        if len(fe_array) > 1:
            trend = np.polyfit(range(len(fe_array)), fe_array, 1)[0]
            analysis["free_energy_trend"] = float(trend)
            analysis["free_energy_decreasing"] = trend < 0

        # Calculate convergence (variance in last 20% of values)
        if len(fe_array) > 5:
            last_portion = fe_array[int(0.8 * len(fe_array)) :]
            analysis["convergence_variance"] = float(np.var(last_portion))
            analysis["converged"] = analysis["convergence_variance"] < 0.1

        return analysis

    except Exception as e:
        logger.error(f"Error analyzing free energy: {e}")
        return {"framework": framework, "model_name": model_name, "error": str(e)}


def analyze_policy_convergence(
    policy_traces: List[Any], framework: str, model_name: str
) -> Dict[str, Any]:
    """
    Analyze policy evolution and convergence.

    Args:
        policy_traces: List of policy distributions over time
        framework: Framework name
        model_name: Model name

    Returns:
        Dictionary with policy convergence analysis
    """
    try:
        analysis: dict[str, Any] = {
            "framework": framework,
            "model_name": model_name,
            "policy_count": len(policy_traces),
            "policy_entropy": [],
            "policy_stability": {},
        }

        if not policy_traces:
            return analysis

        # Calculate entropy for each policy
        for policy in policy_traces:
            if isinstance(policy, (list, tuple, np.ndarray)):
                policy_array = np.array(policy)
                # Normalize to probabilities
                policy_array = (
                    policy_array / np.sum(policy_array)
                    if np.sum(policy_array) > 0
                    else policy_array
                )
                # Calculate entropy
                entropy = -np.sum(policy_array * np.log(policy_array + 1e-10))
                analysis["policy_entropy"].append(float(entropy))

        # Calculate stability (variance in policy entropy)
        if analysis["policy_entropy"]:
            analysis["policy_stability"]["entropy_mean"] = float(
                np.mean(analysis["policy_entropy"])
            )
            analysis["policy_stability"]["entropy_std"] = float(
                np.std(analysis["policy_entropy"])
            )
            analysis["policy_stability"]["stable"] = (
                analysis["policy_stability"]["entropy_std"] < 0.1
            )

        return analysis

    except Exception as e:
        logger.error(f"Error analyzing policy convergence: {e}")
        return {"framework": framework, "model_name": model_name, "error": str(e)}


def analyze_state_distributions(
    state_traces: List[Any], framework: str, model_name: str
) -> Dict[str, Any]:
    """
    Analyze belief state distributions.

    Args:
        state_traces: List of state distributions over time
        framework: Framework name
        model_name: Model name

    Returns:
        Dictionary with state distribution analysis
    """
    try:
        analysis: dict[str, Any] = {
            "framework": framework,
            "model_name": model_name,
            "state_count": len(state_traces),
            "state_entropy": [],
            "state_diversity": {},
        }

        if not state_traces:
            return analysis

        # Calculate entropy for each state distribution
        for state in state_traces:
            if isinstance(state, (list, tuple, np.ndarray)):
                state_array = np.array(state)
                # Normalize to probabilities
                state_array = (
                    state_array / np.sum(state_array)
                    if np.sum(state_array) > 0
                    else state_array
                )
                # Calculate entropy
                entropy = -np.sum(state_array * np.log(state_array + 1e-10))
                analysis["state_entropy"].append(float(entropy))

        # Calculate diversity metrics
        if analysis["state_entropy"]:
            analysis["state_diversity"]["mean_entropy"] = float(
                np.mean(analysis["state_entropy"])
            )
            analysis["state_diversity"]["std_entropy"] = float(
                np.std(analysis["state_entropy"])
            )

        return analysis

    except Exception as e:
        logger.error(f"Error analyzing state distributions: {e}")
        return {"framework": framework, "model_name": model_name, "error": str(e)}


def compare_framework_results(
    framework_results: Dict[str, Dict[str, Any]], model_name: str
) -> Dict[str, Any]:
    """
    Compare results across different frameworks.

    Args:
        framework_results: Dictionary mapping framework names to their results
        model_name: Model name

    Returns:
        Dictionary with cross-framework comparison
    """
    try:
        comparison: dict[str, Any] = {
            "model_name": model_name,
            "frameworks_compared": list(framework_results.keys()),
            "framework_count": len(framework_results),
            "comparisons": {},
        }

        if len(framework_results) < 2:
            comparison["message"] = "Need at least 2 frameworks for comparison"
            return comparison

        # Compare free energy if available
        fe_comparison: dict[Any, Any] = {}
        for framework, results in framework_results.items():
            if "free_energy" in results.get("simulation_data", {}):
                fe_values = results["simulation_data"]["free_energy"]
                if fe_values:
                    fe_comparison[framework] = {
                        "mean": float(np.mean(fe_values)),
                        "min": float(np.min(fe_values)),
                        "max": float(np.max(fe_values)),
                    }

        if fe_comparison:
            comparison["comparisons"]["free_energy"] = fe_comparison
            # Find best (lowest mean free energy)
            best_framework = min(fe_comparison.items(), key=lambda x: x[1]["mean"])
            comparison["comparisons"]["best_free_energy"] = {
                "framework": best_framework[0],
                "mean_fe": best_framework[1]["mean"],
            }

        # Compare execution times
        exec_times: dict[Any, Any] = {}
        for framework, results in framework_results.items():
            if "execution_time" in results:
                exec_times[framework] = results["execution_time"]

        if exec_times:
            comparison["comparisons"]["execution_time"] = exec_times
            fastest_framework = min(exec_times.items(), key=lambda x: x[1])
            comparison["comparisons"]["fastest_execution"] = {
                "framework": fastest_framework[0],
                "time": fastest_framework[1],
            }

        # Compare success rates
        success_rates: dict[Any, Any] = {}
        for framework, results in framework_results.items():
            success_rates[framework] = results.get("success", False)

        if success_rates:
            comparison["comparisons"]["success_rates"] = success_rates

        return comparison

    except Exception as e:
        logger.error(f"Error comparing framework results: {e}")
        return {"model_name": model_name, "error": str(e)}