Package as tree_nlu.

2017-05-23 19:04:10 +02:00 · 2017-05-23 19:04:10 +02:00 · 5297158110
commit 5297158110
parent ec17fca6cf
10 changed files with 184 additions and 164 deletions
--- a/naive-nlu/tree_nlu/init.py
+++ b/naive-nlu/tree_nlu/init.py
--- a/naive-nlu/tree_nlu/depth_meter.py
+++ b/naive-nlu/tree_nlu/depth_meter.py
@ -0,0 +1,11 @@
+import sys
+from . import parameters
+
+def show_depth(depth: int, zoom: int=2):
+    offset = int((parameters.MAX_RECURSIONS - depth) / (2 / zoom))
+
+    depth = depth * zoom
+    offset -= int(depth % 2)
+    sys.stdout.write("\r|\x1b[K" + (u'█' * int(depth / 2)) + (u'▌' * int(depth % 2)) + ' ' * offset + "|\x1b[7m \x1b[0m\b")
+
+    sys.stdout.flush()
--- a/naive-nlu/tree_nlu/knowledge_base.py
+++ b/naive-nlu/tree_nlu/knowledge_base.py
@ -0,0 +1,79 @@
+import copy
+
+import logging
+
+from . import parsing
+from . import knowledge_evaluation
+from .modifiable_property import is_modifiable_property
+
+
+def diff_knowledge(before, after):
+    import jsondiff
+    return jsondiff.diff(before, after)
+
+
+class KnowledgeBase(object):
+    def __init__(self, knowledge, examples=[], trained=[]):
+        self.knowledge = copy.copy(knowledge)
+        self.examples = copy.copy(examples)
+        self.trained = copy.copy(trained)
+
+    def train(self, examples):
+        knowledge_before = copy.deepcopy(self.knowledge)
+
+        # Parse everything
+        parsed_examples = []
+        for example in examples:
+            logging.info("\x1b[7;32m> {} \x1b[0m".format(example))
+            tokens, decomposition, inferred_tree = parsing.integrate_language(self, example)
+            logging.info(tokens)
+            result = knowledge_evaluation.integrate_information(self.knowledge, {
+                "elements": tokens,
+                "decomposition": decomposition,
+                "parsed": inferred_tree,
+            })
+
+            logging.info("\x1b[7;33m< {} \x1b[0m".format(self.get_value(result)))
+            self.act_upon(result)
+            logging.info("\x1b[7;34m> set: {} \x1b[0m".format(self.get_value(result)))
+            self.examples.append((decomposition, inferred_tree))
+
+            # Reduce values
+            self.trained = parsing.reprocess_language_knowledge(self, self.examples)
+
+        knowledge_after = copy.deepcopy(self.knowledge)
+        knowledge_diff_getter = lambda: diff_knowledge(knowledge_before,
+                                                       knowledge_after)
+
+        return knowledge_diff_getter
+
+
+    def process(self, row):
+        knowledge_before = copy.deepcopy(self.knowledge)
+        logging.info("\x1b[7;32m> {} \x1b[0m".format(row))
+        tokens = parsing.to_tokens(row)
+        tokens, inferred_tree = parsing.get_fit(self, tokens)
+        result = knowledge_evaluation.integrate_information(self.knowledge,
+                                                          {
+                                                              "elements": tokens,
+                                                              "parsed": inferred_tree,
+                                                          })
+        self.act_upon(result)
+
+        knowledge_after = copy.deepcopy(self.knowledge)
+        knowledge_diff_getter = lambda: diff_knowledge(knowledge_before,
+                                                       knowledge_after)
+
+        return result, inferred_tree, knowledge_diff_getter
+
+    def get_value(self, result):
+        if is_modifiable_property(result):
+            return result.getter()
+        else:
+            return result
+
+    def act_upon(self, result):
+        if is_modifiable_property(result):
+            result.setter()
+        else:
+            logging.warning("Cannot act upon: {}".format(result))
--- a/naive-nlu/tree_nlu/knowledge_evaluation.py
+++ b/naive-nlu/tree_nlu/knowledge_evaluation.py
@ -0,0 +1,157 @@
+from .modifiable_property import (
+    ModifiableProperty,
+    ModifiablePropertyWithAst,
+    is_modifiable_property,
+)
+
+
+def resolve(knowledge_base, elements, value):
+    if isinstance(value, int):
+        return elements[value]
+    elif isinstance(value, tuple) or isinstance(value, list):
+        return integrate_information(knowledge_base, {
+            "elements": elements,
+            "parsed": value,
+        })
+    return value
+
+
+# TODO: improve typing
+def infer_type(result):
+    if isinstance(result, bool):
+        return "bool"
+    elif isinstance(result, int):
+        return "int"
+
+    else:
+        raise Exception("Unknown type for value: {}".format(result))
+
+
+def get_subquery_type(knowledge_base, atom):
+    subquery_result = integrate_information(knowledge_base,
+                                            {
+                                                "parsed": atom,
+                                                "elements": [],
+                                            })
+    assert (subquery_result is not None)
+    result = subquery_result.getter()
+
+    result_type = infer_type(result)
+    return result_type
+
+
+def property_for_value(knowledge_base, value):
+    return knowledge_base[value]['as_property']
+
+
+def modifiable_property_from_property(prop, path, value):
+    def getter():
+        nonlocal prop, path, value
+        return (path in prop) and prop[path] == value
+
+    def setter():
+        nonlocal prop, path, value
+        prop[path] = value
+
+    return ModifiableProperty(
+        getter=getter,
+        setter=setter,
+    )
+
+
+def exists_property_with_value(knowledge_base, elements, subj, value):
+    subj = resolve(knowledge_base, elements, subj)
+    value = resolve(knowledge_base, elements, value)
+
+    if subj not in knowledge_base:
+        knowledge_base[subj] = {}
+
+    return modifiable_property_from_property(
+        prop=knowledge_base[subj],
+        path=property_for_value(knowledge_base, value),
+        value=value
+    )
+
+
+def modifiable_element_for_existance_in_set(container, set_name, element):
+    def getter():
+        nonlocal container, set_name, element
+        return (set_name in container) and (element in container[set_name])
+
+    def setter():
+        nonlocal container, set_name, element
+        return container[set_name].add(element)
+
+    return ModifiableProperty(
+        getter=getter,
+        setter=setter,
+    )
+
+def pertenence_to_group(knowledge_base, elements, subj, group):
+    subj = resolve(knowledge_base, elements, subj)
+    group = resolve(knowledge_base, elements, group)
+
+    if subj not in knowledge_base:
+        knowledge_base[subj] = {}
+
+    if "groups" not in knowledge_base[subj]:
+        knowledge_base[subj]["groups"] = set()
+
+    return modifiable_element_for_existance_in_set(
+        container=knowledge_base[subj],
+        set_name="groups",
+        element=group
+    )
+
+
+def has_capacity(knowledge_base, elements, subj, capacity):
+    subj = resolve(knowledge_base, elements, subj)
+    capacity = resolve(knowledge_base, elements, capacity)
+
+    if subj not in knowledge_base:
+        knowledge_base[subj] = {}
+
+    if "capacities" not in knowledge_base[subj]:
+        knowledge_base[subj]["capacities"] = set()
+
+    return modifiable_element_for_existance_in_set(
+        container=knowledge_base[subj],
+        set_name="capacities",
+        element=capacity
+    )
+
+
+def question(knowledge_base, elements, subj):
+    subj = resolve(knowledge_base, elements, subj)
+
+    if is_modifiable_property(subj):
+        return subj.getter()
+    return subj
+
+
+knowledge_ingestion = {
+    "exists-property-with-value": exists_property_with_value,
+    "pertenence-to-group": pertenence_to_group,
+    "has-capacity": has_capacity,
+    "question": question,
+}
+
+
+def tagged_with_ast(ast, elements, modifiable_property):
+    if not isinstance(modifiable_property, ModifiableProperty):
+        return modifiable_property
+
+    return ModifiablePropertyWithAst(modifiable_property.getter,
+                                     modifiable_property.setter,
+                                     ast, elements)
+
+
+def integrate_information(knowledge_base, example):
+    ast = example['parsed']
+    method = ast[0]
+    args = ast[1:]
+    elements = example.get('elements', None)
+
+    return tagged_with_ast(
+        ast, elements,
+        knowledge_ingestion[method](knowledge_base, elements, *args))
--- a/naive-nlu/tree_nlu/modifiable_property.py
+++ b/naive-nlu/tree_nlu/modifiable_property.py
@ -0,0 +1,16 @@
+import collections
+
+ModifiableProperty = collections.namedtuple('ModifiableProperty',
+                                            ['getter', 'setter'])
+
+ModifiablePropertyWithAst = collections.namedtuple('ModifiablePropertyWithAst',
+                                                   [
+                                                       'getter',
+                                                       'setter',
+                                                       'ast',
+                                                       'elements',
+                                                   ])
+
+def is_modifiable_property(element):
+    return (isinstance(element, ModifiableProperty) or
+            isinstance(element, ModifiablePropertyWithAst))
--- a/naive-nlu/tree_nlu/parameters.py
+++ b/naive-nlu/tree_nlu/parameters.py
@ -0,0 +1 @@
+MAX_RECURSIONS = 5
--- a/naive-nlu/tree_nlu/parsing.py
+++ b/naive-nlu/tree_nlu/parsing.py
@ -0,0 +1,384 @@
+#!/usr/bin/env python
+
+from . import knowledge_evaluation
+
+from . import depth_meter
+import logging
+import re
+import copy
+
+from functools import reduce
+from typing import List
+from .modifiable_property import ModifiableProperty
+from . import parameters
+
+# TODO: more flexible tokenization
+def to_tokens(text):
+    return re.findall(r'(\w+|[^\s])', text)
+
+
+def make_template(knowledge_base, tokens, parsed):
+    matcher = list(tokens)
+    template = list(parsed)
+    for i in range(len(matcher)):
+        word = matcher[i]
+        if word in template:
+            template[template.index(word)] = i
+            matcher[i] = {
+                'groups': set(knowledge_base.knowledge[word]['groups'])
+            }
+    return tokens, matcher, template
+
+
+def is_bottom_level(tree):
+    for element in tree:
+        if isinstance(element, list) or isinstance(element, tuple):
+            return False
+    return True
+
+
+def get_lower_levels(parsed):
+    lower = []
+    def aux(subtree, path):
+        nonlocal lower
+        deeper = len(path) == 0
+        for i, element in enumerate(subtree):
+            if isinstance(element, list) or isinstance(element, tuple):
+                aux(element, path + (i,))
+                deeper = True
+
+        if not deeper:
+            lower.append((path, subtree))
+
+    aux(parsed, path=())
+    return lower
+
+
+# TODO: probably optimize this, it creates lots of unnecessary tuples
+def replace_position(tree, position, new_element):
+
+    def aux(current_tree, remaining_route):
+        if len(remaining_route) == 0:
+            return new_element
+
+        else:
+            step = remaining_route[0]
+            return (
+                tree[:step]
+                + (aux(tree[step], remaining_route[1:]),)
+                + tree[step + 2:]
+            )
+
+    return aux(tree, position)
+
+
+def integrate_language(knowledge_base, example):
+    text = example["text"].lower()
+    parsed = example["parsed"]
+
+    resolved_parsed = copy.deepcopy(parsed)
+    tokens = to_tokens(text)
+
+    while True:
+        logging.debug("P: {}".format(resolved_parsed))
+        lower_levels = get_lower_levels(resolved_parsed)
+        logging.debug("Lower: {}".format(lower_levels))
+        if len(lower_levels) == 0:
+            break
+
+        for position, atom in lower_levels:
+            logging.debug("\x1b[1mSelecting\x1b[0m: {}".format(atom))
+            similar = get_similar_tree(knowledge_base, atom)
+            remix, (start_bounds, end_bounds) = build_remix_matrix(knowledge_base, tokens, atom, similar)
+            _, matcher, result = make_template(knowledge_base, tokens, atom)
+            logging.debug("Tx: {}".format(tokens))
+            logging.debug("Mx: {}".format(matcher))
+            logging.debug("Rx: {}".format(result))
+            logging.debug("Remix: {}".format(remix))
+
+            after_remix = apply_remix(tokens[len(start_bounds):-len(end_bounds)], remix)
+            assert(len(after_remix) + len(start_bounds) + len(end_bounds) == len(tokens))
+            logging.debug( "  +-> {}".format(after_remix))
+            subquery_type = knowledge_evaluation.get_subquery_type(knowledge_base.knowledge, atom)
+            logging.debug(r"  \-> <{}>".format(subquery_type))
+
+            # Clean remaining tokens
+            new_tokens = list(tokens)
+            offset = len(start_bounds)
+            for _ in range(len(remix)):
+                new_tokens.pop(offset)
+
+            # TODO: Get a specific types for... types
+            new_tokens.insert(offset, (subquery_type, remix))
+            tokens = new_tokens
+
+            resolved_parsed = replace_position(resolved_parsed, position, offset)
+            logging.debug("#########")
+
+
+    tokens, matcher, result = make_template(knowledge_base, tokens, resolved_parsed)
+    logging.debug("T: {}".format(tokens))
+    logging.debug("M: {}".format(matcher))
+    logging.debug("R: {}".format(result))
+    logging.debug("---")
+    return tokens, matcher, result
+
+
+def apply_remix(tokens, remix):
+    rebuilt = []
+    for i in remix:
+        rebuilt.append(tokens[i])
+    return rebuilt
+
+
+def build_remix_matrix(knowledge_base, tokens, atom, similar):
+    tokens = list(tokens)
+    tokens, matcher, result = make_template(knowledge_base, tokens, atom)
+    similar_matcher, similar_result, similar_result_resolved, _ = similar
+
+    start_bounds, end_bounds = find_bounds(matcher, similar_matcher)
+
+    for i, element in (end_bounds + start_bounds[::-1]):
+        matcher.pop(i)
+        tokens.pop(i)
+
+    possible_remixes = get_possible_remixes(knowledge_base, matcher, similar_matcher)
+    chosen_remix = possible_remixes[0]
+
+    return chosen_remix, (start_bounds, end_bounds)
+
+
+def get_possible_remixes(knowledge_base, matcher, similar_matcher):
+
+    matrix = []
+    for element in matcher:
+        logging.debug("- {}".format(element))
+        logging.debug("+ {}".format(similar_matcher))
+        assert(element in similar_matcher or isinstance(element, dict))
+
+        if isinstance(element, dict):
+            indexes = all_matching_indexes(knowledge_base, similar_matcher, element)
+        else:
+            indexes = all_indexes(similar_matcher, element)
+        matrix.append(indexes)
+
+    # TODO: do some scoring to find the most "interesting combination"
+    return [list(x) for x in list(zip(*matrix))]
+
+
+def all_indexes(collection, element):
+    indexes = []
+    base = 0
+
+    for _ in range(collection.count(element)):
+        i = collection.index(element, base)
+        base = i + 1
+        indexes.append(i)
+
+    return indexes
+
+
+def all_matching_indexes(knowledge_base, collection, element):
+    indexes = []
+
+    assert("groups" in element)
+    element = element["groups"]
+    for i, instance in enumerate(collection):
+        if isinstance(instance, dict):
+            instance = instance["groups"]
+        elif instance in knowledge_base.knowledge:
+            instance = knowledge_base.knowledge[instance]["groups"]
+
+        intersection = set(instance) & set(element)
+        if len(intersection) > 0:
+            indexes.append((i, intersection))
+
+    return [x[0] for x in sorted(indexes, key=lambda x: len(x[1]), reverse=True)]
+
+
+def find_bounds(matcher, similar_matcher):
+    start_bounds = []
+    for i, element in enumerate(matcher):
+        if element in similar_matcher:
+            break
+        else:
+            start_bounds.append((i, element))
+
+    end_bounds = []
+    for i, element in enumerate(matcher[::-1]):
+        if element in similar_matcher:
+            break
+        else:
+            end_bounds.append((len(matcher) - (i + 1), element))
+
+    return start_bounds, end_bounds
+
+
+def get_similar_tree(knowledge_base, atom):
+    possibilities = []
+
+    # Find matching possibilities
+    for entry, tree in knowledge_base.trained:
+        if not is_bottom_level(tree):
+            continue
+        if tree[0] == atom[0]:
+            possibilities.append((entry, tree))
+
+    # Sort by more matching elements
+    sorted_possibilities = []
+    for (raw, possibility) in possibilities:
+        resolved = []
+        for element in atom:
+            if isinstance(element, str):
+                resolved.append(element)
+            else:
+                resolved.append(knowledge_evaluation.resolve(
+                    knowledge_base.knowledge,
+                    element,
+                    raw))
+
+        # TODO: Probably should take into account the categories of the elements in the "intake" ([0]) element
+        score = sum([resolved[i] == atom[i]
+                     for i
+                     in range(min(len(resolved),
+                                  len(atom)))])
+        sorted_possibilities.append((raw, possibility, resolved, score))
+    sorted_possibilities = sorted(sorted_possibilities, key=lambda p: p[3], reverse=True)
+    if len(sorted_possibilities) < 1:
+        return None
+
+    return sorted_possibilities[0]
+
+
+# TODO: unroll this mess
+def get_matching(sample, other):
+    l = len(sample[0])
+    other = list(filter(lambda x: len(x[0]) == l, other))
+    for i in range(l):
+        if len(other) == 0:
+            return []
+
+        if isinstance(sample[0][i], dict): # Dictionaries are compared by groups
+            other = list(filter(lambda x: isinstance(x[0][i], dict) and
+                                len(x[0][i]['groups'] & sample[0][i]['groups']) > 0,
+                                other))
+
+        elif isinstance(sample[0][i], tuple): # Tuples are compared by types [0]
+            other = list(filter(lambda x: isinstance(x[0][i], tuple) and
+                                x[0][i][0] == sample[0][i][0],
+                                other))
+
+    return [sample[0][x] if isinstance(sample[0][x], str)
+            else
+            sample[0][x] if isinstance(sample[0][x], tuple)
+            else {'groups': sample[0][x]['groups'] & reduce(lambda a, b: a & b,
+                                                            map(lambda y: y[0][x]['groups'],
+                                                                other))}
+            for x
+            in range(l)]
+
+
+def reprocess_language_knowledge(knowledge_base, examples):
+    examples = knowledge_base.examples + examples
+
+    pattern_examples = []
+    for i, sample in enumerate(examples):
+        other = examples[:i] + examples[i + 1:]
+        match = get_matching(sample, other)
+        if len(match) > 0:
+            sample = (match, sample[1],)
+        pattern_examples.append(sample)
+
+    return pattern_examples
+
+
+def reverse_remix(tree_section, remix):
+    result_section = []
+    for origin in remix:
+        result_section.append(copy.deepcopy(tree_section[origin]))
+    return result_section + tree_section[len(remix):]
+
+
+def get_fit(knowledge, tokens, remaining_recursions=parameters.MAX_RECURSIONS):
+    for matcher, ast in knowledge.trained:
+        result = match_fit(knowledge, tokens, matcher, ast,
+                           remaining_recursions)
+        if result is not None:
+            return result
+
+    return None
+
+
+def is_definite_minisegment(minisegment):
+    return isinstance(minisegment, str) or isinstance(minisegment, dict)
+
+
+def match_token(knowledge, next_token, minisegment):
+    if isinstance(minisegment, dict):
+        # TODO: check if the dictionary matches the values
+        return True
+    elif isinstance(minisegment, str):
+        # TODO: check if the two elements can be used in each other place
+        return next_token == minisegment
+
+    return False
+
+
+def resolve_fit(knowledge, fit, remaining_recursions):
+    fitted = []
+    for element in fit:
+        if is_definite_minisegment(element):
+            fitted.append(element)
+        else:
+            ((result_type, remixer), tokens) = element
+            remixed_tokens = reverse_remix(tokens, remixer)
+            minifit = get_fit(knowledge, remixed_tokens, remaining_recursions - 1)
+            if minifit is None:
+                return None
+
+            minitokens, miniast = minifit
+            subproperty = knowledge_evaluation.resolve(knowledge.knowledge, minitokens, miniast)
+            fitted.append(subproperty)
+
+    return fitted
+
+
+def match_fit(knowledge, tokens, matcher, ast, remaining_recursions):
+    segment_possibilities = [([], tokens)]  # Matched tokens, remaining tokens
+    for minisegment in matcher:
+        possibilities_after_round = []
+        for matched_tokens, remaining_tokens in segment_possibilities:
+            if len(remaining_tokens) < 1:
+                continue
+
+            if is_definite_minisegment(minisegment):
+                if match_token(knowledge, remaining_tokens[0], minisegment):
+                    possibilities_after_round.append((
+                        matched_tokens + [remaining_tokens[0]],
+                        remaining_tokens[1:]
+                    ))
+            else:
+                # TODO: optimize this with a look ahead
+                for i in range(1, len(tokens)):
+                    possibilities_after_round.append((
+                        matched_tokens + [(minisegment, remaining_tokens[:i])],
+                        remaining_tokens[i:]
+                    ))
+        else:
+            segment_possibilities = possibilities_after_round
+
+    fully_matched_segments = [(matched, remaining)
+                              for (matched, remaining)
+                              in segment_possibilities
+                              if len(remaining) == 0]
+
+    resolved_fits = []
+    for fit, _ in fully_matched_segments:
+        resolved_fit = resolve_fit(knowledge, fit, remaining_recursions)
+        if resolved_fit is not None:
+            resolved_fits.append(resolved_fit)
+
+    if len(resolved_fits) == 0:
+        return None
+
+    return resolved_fits[0], ast
--- a/naive-nlu/tree_nlu/test.py
+++ b/naive-nlu/tree_nlu/test.py
@ -0,0 +1,157 @@
+import json
+import logging
+
+logging.getLogger().setLevel(logging.INFO)
+
+from .knowledge_base import KnowledgeBase
+from .modifiable_property import is_modifiable_property
+
+examples = [
+    {
+        "text": "icecream is cold",
+        "parsed": ("exists-property-with-value", 'icecream', 'cold'),
+    },
+    {
+        "text": "is icecream cold?",
+        "parsed": ("question", ("exists-property-with-value", 'icecream', 'cold'))
+    },
+    {
+        "text": "lava is dangerous",
+        "parsed": ("exists-property-with-value", 'lava', 'dangerous')
+    },
+    {
+        "text": "is lava dangerous?",
+        "parsed": ("question", ("exists-property-with-value", 'lava', 'dangerous')),
+    },
+    {
+        "text": "earth is a planet",
+        "parsed": ("pertenence-to-group", 'earth', 'planet'),
+    },
+    {
+        "text": "io is a moon",
+        "parsed": ("pertenence-to-group", 'io', 'moon'),
+    },
+    {
+        "text": "is earth a moon?",
+        "parsed": ("question", ("pertenence-to-group", 'earth', 'moon')),
+    },
+    {
+        "text": "Green is a color",
+        "parsed": ("pertenence-to-group", 'green', 'color'),
+    },
+    {
+        "text": "a plane can fly",
+        "parsed": ("has-capacity", 'plane', 'fly')
+    },
+    {
+        "text": "a wale can swim",
+        "parsed": ("has-capacity", 'wale', 'swim')
+    },
+    {
+        "text": "if earth is a planet, it is big",
+        "parsed": ("implies",
+                   ("pertenence-to-group", 'earth', 'planet'),
+                   ("exists-property-with-value", 'earth', 'big')),
+    },
+]
+
+base_knowledge = {
+    'icecream': {
+        "groups": set(['noun', 'object', 'comestible', 'sweet']),
+    },
+    'lava': {
+        "groups": set(['noun', 'object']),
+    },
+    'earth': {
+        "groups": set(['noun', 'object', 'planet']),
+    },
+    'io': {
+        "groups": set(['noun', 'object']),
+    },
+    'green': {
+        "groups": set(['noun', 'color', 'concept']),
+    },
+    'plane': {
+        "groups": set(['noun', 'object', 'vehicle', 'fast']),
+    },
+    'car': {
+        "groups": set(['noun', 'object', 'vehicle', 'slow-ish']),
+    },
+    'wale': {
+        "groups": set(['noun', 'object', 'living-being']),
+    },
+    'cold': {
+        "groups": set(['property', 'temperature']),
+        "as_property": "temperature",
+    },
+    'dangerous': {
+        "groups": set(['property']),
+        "as_property": "safety",
+    },
+    'planet': {
+        "groups": set(['noun', 'group']),
+    },
+    'moon': {
+        "groups": set(['noun', 'group']),
+    },
+    'color': {
+        "groups": set(['property', 'group']),
+    },
+    'fly': {
+        "groups": set(['verb']),
+    },
+    'swim': {
+        "groups": set(['verb']),
+    },
+}
+
+
+def test_assumption(expectedResponse, knowledge, query):
+    logging.info("Query: {}".format(query['text']))
+    logging.info("Expected: {}".format(expectedResponse))
+
+    result, abstract_tree, diff = knowledge.process(query['text'])
+    end_result = result.getter() if is_modifiable_property(result) else result
+
+    logging.info("\x1b[0;3{}mResult: {}\x1b[0m".format("1" if end_result != expectedResponse else "2", end_result))
+    assert(end_result == expectedResponse)
+
+
+def main():
+    knowledge = KnowledgeBase(
+        knowledge=base_knowledge,
+    )
+
+    differences = knowledge.train(examples)
+
+    logging.info("----")
+    logging.info(differences())
+    logging.info("----")
+
+    test_assumption(True, knowledge, {'text': 'earth is a planet'})
+    test_assumption(True, knowledge, {'text': 'is lava dangerous?'})
+    for test in [{'text': 'a bus can run'}, {'text': 'io is a moon'}]:
+        row = test['text']
+        result, inferred_tree, differences = knowledge.process(row)
+
+        logging.info("result:", result)
+        logging.info(differences())
+        logging.info("---")
+    logging.info('-----')
+    logging.info(json.dumps(sorted(knowledge.knowledge.keys()), indent=4))
+    logging.info('-----')
+
+    queryTrue = {
+        "text": "is io a moon?",
+        "parsed": ("question", ("pertenence-to-group", "io", "moon"))
+    }
+    queryFalse = {
+        "text": "is io a planet?",
+        "parsed": ("question", ("pertenence-to-group", "io", "planet"))
+    }
+
+    test_assumption(False, knowledge, queryFalse)
+    test_assumption(True, knowledge, queryTrue)
+
+if __name__ == '__main__':
+    main()