|
2 | 2 | "cells": [ |
3 | 3 | { |
4 | 4 | "cell_type": "code", |
5 | | - "execution_count": 0, |
| 5 | + "execution_count": null, |
6 | 6 | "metadata": { |
7 | 7 | "collapsed": true |
8 | 8 | }, |
|
15 | 15 | "outputs": [ |
16 | 16 | { |
17 | 17 | "data": { |
18 | | - "text/plain": "'0.2.2'" |
| 18 | + "text/plain": "'0.2.8'" |
19 | 19 | }, |
20 | 20 | "execution_count": 1, |
21 | 21 | "metadata": {}, |
|
70 | 70 | "outputs": [ |
71 | 71 | { |
72 | 72 | "data": { |
73 | | - "text/plain": " threshold count fraction precision true_positive_rate \\\n0 0.999999 5 1.0 0.400000 1.0 \n1 1.000000 5 1.0 0.400000 1.0 \n2 2.000000 4 0.8 0.500000 1.0 \n3 3.000000 3 0.6 0.666667 1.0 \n4 4.000000 2 0.4 0.500000 0.5 \n5 5.000000 1 0.2 0.000000 0.0 \n6 5.000001 0 0.0 NaN 0.0 \n\n false_positive_rate true_negative_rate false_negative_rate enrichment \\\n0 1.000000 0.000000 0.0 1.400000 \n1 1.000000 0.000000 0.0 1.400000 \n2 0.666667 0.333333 0.0 1.750000 \n3 0.333333 0.666667 0.0 2.333333 \n4 0.333333 0.666667 0.5 1.750000 \n5 0.333333 0.666667 1.0 0.000000 \n6 0.000000 1.000000 1.0 NaN \n\n gain lift recall sensitivity specificity \n0 1.400000 1.400000 1.0 1.0 0.000000 \n1 1.400000 1.400000 1.0 1.0 0.000000 \n2 1.750000 2.187500 1.0 1.0 0.333333 \n3 2.333333 3.888889 1.0 1.0 0.666667 \n4 1.750000 4.375000 0.5 0.5 0.666667 \n5 0.000000 0.000000 0.0 0.0 0.666667 \n6 NaN NaN 0.0 0.0 1.000000 ", |
74 | | - "text/html": "<div>\n<style scoped>\n .dataframe tbody tr th:only-of-type {\n vertical-align: middle;\n }\n\n .dataframe tbody tr th {\n vertical-align: top;\n }\n\n .dataframe thead th {\n text-align: right;\n }\n</style>\n<table border=\"1\" class=\"dataframe\">\n <thead>\n <tr style=\"text-align: right;\">\n <th></th>\n <th>threshold</th>\n <th>count</th>\n <th>fraction</th>\n <th>precision</th>\n <th>true_positive_rate</th>\n <th>false_positive_rate</th>\n <th>true_negative_rate</th>\n <th>false_negative_rate</th>\n <th>enrichment</th>\n <th>gain</th>\n <th>lift</th>\n <th>recall</th>\n <th>sensitivity</th>\n <th>specificity</th>\n </tr>\n </thead>\n <tbody>\n <tr>\n <th>0</th>\n <td>0.999999</td>\n <td>5</td>\n <td>1.0</td>\n <td>0.400000</td>\n <td>1.0</td>\n <td>1.000000</td>\n <td>0.000000</td>\n <td>0.0</td>\n <td>1.400000</td>\n <td>1.400000</td>\n <td>1.400000</td>\n <td>1.0</td>\n <td>1.0</td>\n <td>0.000000</td>\n </tr>\n <tr>\n <th>1</th>\n <td>1.000000</td>\n <td>5</td>\n <td>1.0</td>\n <td>0.400000</td>\n <td>1.0</td>\n <td>1.000000</td>\n <td>0.000000</td>\n <td>0.0</td>\n <td>1.400000</td>\n <td>1.400000</td>\n <td>1.400000</td>\n <td>1.0</td>\n <td>1.0</td>\n <td>0.000000</td>\n </tr>\n <tr>\n <th>2</th>\n <td>2.000000</td>\n <td>4</td>\n <td>0.8</td>\n <td>0.500000</td>\n <td>1.0</td>\n <td>0.666667</td>\n <td>0.333333</td>\n <td>0.0</td>\n <td>1.750000</td>\n <td>1.750000</td>\n <td>2.187500</td>\n <td>1.0</td>\n <td>1.0</td>\n <td>0.333333</td>\n </tr>\n <tr>\n <th>3</th>\n <td>3.000000</td>\n <td>3</td>\n <td>0.6</td>\n <td>0.666667</td>\n <td>1.0</td>\n <td>0.333333</td>\n <td>0.666667</td>\n <td>0.0</td>\n <td>2.333333</td>\n <td>2.333333</td>\n <td>3.888889</td>\n <td>1.0</td>\n <td>1.0</td>\n <td>0.666667</td>\n </tr>\n <tr>\n <th>4</th>\n <td>4.000000</td>\n <td>2</td>\n <td>0.4</td>\n <td>0.500000</td>\n <td>0.5</td>\n <td>0.333333</td>\n <td>0.666667</td>\n <td>0.5</td>\n <td>1.750000</td>\n <td>1.750000</td>\n <td>4.375000</td>\n <td>0.5</td>\n <td>0.5</td>\n <td>0.666667</td>\n </tr>\n <tr>\n <th>5</th>\n <td>5.000000</td>\n <td>1</td>\n <td>0.2</td>\n <td>0.000000</td>\n <td>0.0</td>\n <td>0.333333</td>\n <td>0.666667</td>\n <td>1.0</td>\n <td>0.000000</td>\n <td>0.000000</td>\n <td>0.000000</td>\n <td>0.0</td>\n <td>0.0</td>\n <td>0.666667</td>\n </tr>\n <tr>\n <th>6</th>\n <td>5.000001</td>\n <td>0</td>\n <td>0.0</td>\n <td>NaN</td>\n <td>0.0</td>\n <td>0.000000</td>\n <td>1.000000</td>\n <td>1.0</td>\n <td>NaN</td>\n <td>NaN</td>\n <td>NaN</td>\n <td>0.0</td>\n <td>0.0</td>\n <td>1.000000</td>\n </tr>\n </tbody>\n</table>\n</div>" |
| 73 | + "text/plain": " threshold count fraction precision true_positive_rate \\\n0 0.999999 5 1.0 0.400000 1.0 \n1 1.000000 5 1.0 0.400000 1.0 \n2 2.000000 4 0.8 0.500000 1.0 \n3 3.000000 3 0.6 0.666667 1.0 \n4 4.000000 2 0.4 0.500000 0.5 \n5 5.000000 1 0.2 0.000000 0.0 \n6 5.000001 0 0.0 0.000000 0.0 \n\n false_positive_rate true_negative_rate false_negative_rate accuracy \\\n0 1.000000 0.000000 0.0 0.4 \n1 1.000000 0.000000 0.0 0.4 \n2 0.666667 0.333333 0.0 0.6 \n3 0.333333 0.666667 0.0 0.8 \n4 0.333333 0.666667 0.5 0.6 \n5 0.333333 0.666667 1.0 0.4 \n6 0.000000 1.000000 1.0 0.6 \n\n cdf recall sensitivity specificity \n0 0.0 1.0 1.0 0.000000 \n1 0.0 1.0 1.0 0.000000 \n2 0.2 1.0 1.0 0.333333 \n3 0.4 1.0 1.0 0.666667 \n4 0.6 0.5 0.5 0.666667 \n5 0.8 0.0 0.0 0.666667 \n6 1.0 0.0 0.0 1.000000 ", |
| 74 | + "text/html": "<div>\n<style scoped>\n .dataframe tbody tr th:only-of-type {\n vertical-align: middle;\n }\n\n .dataframe tbody tr th {\n vertical-align: top;\n }\n\n .dataframe thead th {\n text-align: right;\n }\n</style>\n<table border=\"1\" class=\"dataframe\">\n <thead>\n <tr style=\"text-align: right;\">\n <th></th>\n <th>threshold</th>\n <th>count</th>\n <th>fraction</th>\n <th>precision</th>\n <th>true_positive_rate</th>\n <th>false_positive_rate</th>\n <th>true_negative_rate</th>\n <th>false_negative_rate</th>\n <th>accuracy</th>\n <th>cdf</th>\n <th>recall</th>\n <th>sensitivity</th>\n <th>specificity</th>\n </tr>\n </thead>\n <tbody>\n <tr>\n <th>0</th>\n <td>0.999999</td>\n <td>5</td>\n <td>1.0</td>\n <td>0.400000</td>\n <td>1.0</td>\n <td>1.000000</td>\n <td>0.000000</td>\n <td>0.0</td>\n <td>0.4</td>\n <td>0.0</td>\n <td>1.0</td>\n <td>1.0</td>\n <td>0.000000</td>\n </tr>\n <tr>\n <th>1</th>\n <td>1.000000</td>\n <td>5</td>\n <td>1.0</td>\n <td>0.400000</td>\n <td>1.0</td>\n <td>1.000000</td>\n <td>0.000000</td>\n <td>0.0</td>\n <td>0.4</td>\n <td>0.0</td>\n <td>1.0</td>\n <td>1.0</td>\n <td>0.000000</td>\n </tr>\n <tr>\n <th>2</th>\n <td>2.000000</td>\n <td>4</td>\n <td>0.8</td>\n <td>0.500000</td>\n <td>1.0</td>\n <td>0.666667</td>\n <td>0.333333</td>\n <td>0.0</td>\n <td>0.6</td>\n <td>0.2</td>\n <td>1.0</td>\n <td>1.0</td>\n <td>0.333333</td>\n </tr>\n <tr>\n <th>3</th>\n <td>3.000000</td>\n <td>3</td>\n <td>0.6</td>\n <td>0.666667</td>\n <td>1.0</td>\n <td>0.333333</td>\n <td>0.666667</td>\n <td>0.0</td>\n <td>0.8</td>\n <td>0.4</td>\n <td>1.0</td>\n <td>1.0</td>\n <td>0.666667</td>\n </tr>\n <tr>\n <th>4</th>\n <td>4.000000</td>\n <td>2</td>\n <td>0.4</td>\n <td>0.500000</td>\n <td>0.5</td>\n <td>0.333333</td>\n <td>0.666667</td>\n <td>0.5</td>\n <td>0.6</td>\n <td>0.6</td>\n <td>0.5</td>\n <td>0.5</td>\n <td>0.666667</td>\n </tr>\n <tr>\n <th>5</th>\n <td>5.000000</td>\n <td>1</td>\n <td>0.2</td>\n <td>0.000000</td>\n <td>0.0</td>\n <td>0.333333</td>\n <td>0.666667</td>\n <td>1.0</td>\n <td>0.4</td>\n <td>0.8</td>\n <td>0.0</td>\n <td>0.0</td>\n <td>0.666667</td>\n </tr>\n <tr>\n <th>6</th>\n <td>5.000001</td>\n <td>0</td>\n <td>0.0</td>\n <td>0.000000</td>\n <td>0.0</td>\n <td>0.000000</td>\n <td>1.000000</td>\n <td>1.0</td>\n <td>0.6</td>\n <td>1.0</td>\n <td>0.0</td>\n <td>0.0</td>\n <td>1.000000</td>\n </tr>\n </tbody>\n</table>\n</div>" |
75 | 75 | }, |
76 | 76 | "execution_count": 3, |
77 | 77 | "metadata": {}, |
|
96 | 96 | }, |
97 | 97 | { |
98 | 98 | "cell_type": "code", |
99 | | - "execution_count": 5, |
| 99 | + "execution_count": 4, |
100 | 100 | "outputs": [ |
101 | 101 | { |
102 | | - "data": { |
103 | | - "text/plain": "\"pandas.DataFrame({\\n 'threshold': [0.999999, 1.0, 2.0, 3.0, 4.0, 5.0, 5.000001],\\n 'count': [5, 5, 4, 3, 2, 1, 0],\\n 'fraction': [1.0, 1.0, 0.8, 0.6, 0.4, 0.2, 0.0],\\n 'precision': [0.4, 0.4, 0.5, 0.6666666666666666, 0.5, 0.0, None],\\n 'true_positive_rate': [1.0, 1.0, 1.0, 1.0, 0.5, 0.0, 0.0],\\n 'false_positive_rate': [1.0, 1.0, 0.6666666666666666, 0.3333333333333333, 0.3333333333333333, 0.3333333333333333, 0.0],\\n 'true_negative_rate': [0.0, 0.0, 0.3333333333333333, 0.6666666666666666, 0.6666666666666666, 0.6666666666666666, 1.0],\\n 'false_negative_rate': [0.0, 0.0, 0.0, 0.0, 0.5, 1.0, 1.0],\\n 'enrichment': [1.4000000000000001, 1.4000000000000001, 1.75, 2.3333333333333335, 1.75, 0.0, None],\\n 'gain': [1.4000000000000001, 1.4000000000000001, 1.75, 2.3333333333333335, 1.75, 0.0, None],\\n 'lift': [1.4000000000000001, 1.4000000000000001, 2.1875, 3.8888888888888893, 4.375, 0.0, None],\\n 'recall': [1.0, 1.0, 1.0, 1.0, 0.5, 0.0, 0.0],\\n 'sensitivity': [1.0, 1.0, 1.0, 1.0, 0.5, 0.0, 0.0],\\n 'specificity': [0.0, 0.0, 0.33333333333333337, 0.6666666666666667, 0.6666666666666667, 0.6666666666666667, 1.0],\\n })\"" |
104 | | - }, |
105 | | - "execution_count": 5, |
106 | | - "metadata": {}, |
107 | | - "output_type": "execute_result" |
| 102 | + "name": "stdout", |
| 103 | + "output_type": "stream", |
| 104 | + "text": [ |
| 105 | + "pd.DataFrame({\n", |
| 106 | + " 'threshold': [0.999999, 1.0, 2.0, 3.0, 4.0, 5.0, 5.000001],\n", |
| 107 | + " 'count': [5, 5, 4, 3, 2, 1, 0],\n", |
| 108 | + " 'fraction': [1.0, 1.0, 0.8, 0.6, 0.4, 0.2, 0.0],\n", |
| 109 | + " 'precision': [0.4, 0.4, 0.5, 0.6666666666666666, 0.5, 0.0, 0.0],\n", |
| 110 | + " 'true_positive_rate': [1.0, 1.0, 1.0, 1.0, 0.5, 0.0, 0.0],\n", |
| 111 | + " 'false_positive_rate': [1.0, 1.0, 0.6666666666666666, 0.3333333333333333, 0.3333333333333333, 0.3333333333333333, 0.0],\n", |
| 112 | + " 'true_negative_rate': [0.0, 0.0, 0.3333333333333333, 0.6666666666666666, 0.6666666666666666, 0.6666666666666666, 1.0],\n", |
| 113 | + " 'false_negative_rate': [0.0, 0.0, 0.0, 0.0, 0.5, 1.0, 1.0],\n", |
| 114 | + " 'accuracy': [0.4, 0.4, 0.6, 0.8, 0.6, 0.4, 0.6],\n", |
| 115 | + " 'cdf': [0.0, 0.0, 0.19999999999999996, 0.4, 0.6, 0.8, 1.0],\n", |
| 116 | + " 'recall': [1.0, 1.0, 1.0, 1.0, 0.5, 0.0, 0.0],\n", |
| 117 | + " 'sensitivity': [1.0, 1.0, 1.0, 1.0, 0.5, 0.0, 0.0],\n", |
| 118 | + " 'specificity': [0.0, 0.0, 0.33333333333333337, 0.6666666666666667, 0.6666666666666667, 0.6666666666666667, 1.0],\n", |
| 119 | + " })\n" |
| 120 | + ] |
108 | 121 | } |
109 | 122 | ], |
110 | 123 | "source": [ |
111 | 124 | "import data_algebra.util\n", |
112 | 125 | "\n", |
113 | | - "data_algebra.util.pandas_to_example_str(stats)" |
| 126 | + "print(data_algebra.util.pandas_to_example_str(stats))" |
114 | 127 | ], |
115 | 128 | "metadata": { |
116 | 129 | "collapsed": false, |
|
0 commit comments