Last CLI enabled version.

Yanivmd · Mar 6, 2014 · 2a5ced8 · 2a5ced8
commit 2a5ced8
Show file tree

Hide file tree

Showing 25 changed files with 5,752 additions and 0 deletions.
diff --git a/GetStats.py b/GetStats.py
@@ -0,0 +1,128 @@
+#!/usr/bin/python
+
+import os
+import sys
+import igraph
+from myutils import functionsGraphsDirectoryName
+import split2k
+
+import numpy as np
+
+sys.stdout = os.fdopen(sys.stdout.fileno(), 'w', 0)
+myExt = ".gml"
+Koptions = [1,2,3] #,4,5
+
+tracePrints = True
+
+sourceNames = ['getftp',"quotearg_buffer_restyled","sub_4047A0"]
+BaseDir = os.path.join("..","workset","cloneWars","ALL")
+sourcesDir = os.path.join(BaseDir,"sources") 
+targetsDir = os.path.join(BaseDir,"targets")
+
+
+#import locale
+#locale.setlocale(locale.LC_ALL, 'en_US')
+
+import re
+
+def comma_me(intAmount):
+    amount = str(intAmount)
+    orig = amount
+    new = re.sub("^(-?\d+)(\d{3})", '\g<1>,\g<2>', amount)
+    if orig == new:
+        return new
+    else:
+        return comma_me(new)
+
+def printInt(myInt):
+    #return locale.format("%d",myInt,grouping=True)
+    return comma_me(myInt)
+
+def getStats(collection):
+    if len(collection) == 0:
+        return "EMPTY (len==0)" 
+    else:
+        return " Sum:[" + printInt(sum(collection)) + "],Min:[" + printInt(min(collection)) + "],Max:[" + printInt(max(collection)) + "],Avg:[" + printInt(np.mean(collection)) + "],STD:[" + printInt(np.std(collection)) + "]"
+
+#target tracelets info - number of tracelets
+
+print "Sources (paper targets)\n\n"
+
+
+
+for sourceName in sourceNames:
+    refGraph = igraph.read(os.path.join(sourcesDir,sourceName) + myExt)
+    for k in Koptions:
+        counter = 0
+        for tracelet in split2k.ksplitGraphObject(k, refGraph , True):
+            counter += 1
+
+        print sourceName + ": K=" + str(k) + " , count = " + str(counter)    
+
+print "\n\nTargets (paper references)\n\n"
+
+dictK = {}
+for k in Koptions:
+    dictK[k] = {}
+    for collectionName in ["traceletPerFunctionInfo","opcodePerTraceletInfo","opcodePerBasicBlock","callsPerBB","callsPerTrace"]:
+        dictK[k][collectionName] = []
+
+Degrees = {"VInDegree":[],"VOutDgree":[]}
+BBInGraphs = []
+
+for exeName in os.listdir(targetsDir):
+    numberOfFunctionsInTarget = 0
+    currentExeDir = os.path.join(targetsDir,os.path.join(exeName,functionsGraphsDirectoryName))
+
+    for funcFileName in filter(lambda x:x.endswith(myExt),os.listdir(currentExeDir)):
+
+        tarGraph = igraph.read(os.path.join(currentExeDir,funcFileName))
+
+        BBInGraphs.append(len(tarGraph.vs))
+
+        continue
+
+        for v in tarGraph.vs:
+            Degrees['VInDegree'].append(v.indegree())
+            Degrees['VOutDgree'].append(v.outdegree())
+
+        for k in Koptions:
+
+            traceletPerFunction  = 0
+            dictUsed = dictK[k]
+
+            for tracelet in split2k.ksplitGraphObject(k, tarGraph , True):
+                traceletPerFunction +=1
+                BB = []
+                callsBB = []
+
+                for v in tracelet.vs:
+                    opcodesInBB = v['code'].count(";")
+                    BB.append(opcodesInBB)
+                    dictUsed['opcodePerBasicBlock'].append(opcodesInBB)
+                    callsInBB = v['code'].count("call ")
+                    callsBB.append(callsInBB)
+                    dictUsed['callsPerBB'].append(callsInBB)
+
+                dictUsed['opcodePerTraceletInfo'].append(sum(BB))
+                dictUsed['callsPerTrace'].append(sum(callsBB))
+
+            dictUsed['traceletPerFunctionInfo'].append(traceletPerFunction)
+
+
+print "BBInGraphs" +":",
+print getStats(BBInGraphs)
+
+return 
+
+for k in Koptions:
+    print "Data for K=" + str(k)
+    dictUsed = dictK[k]
+    for collectionName in ["traceletPerFunctionInfo","opcodePerTraceletInfo","opcodePerBasicBlock","callsPerBB","callsPerTrace"]:
+        print collectionName +":",
+        print getStats(dictUsed[collectionName])
+
+
+for key in Degrees.keys():
+    print key +":",
+    print getStats(Degrees[key])
diff --git a/GraphletRewritter.py b/GraphletRewritter.py
@@ -0,0 +1,168 @@
+#-------------------------------------------------------------------------------
+# Name:        module1
+# Purpose:
+#
+# Author:      user
+#
+# Created:     17/08/2013
+# Copyright:   (c) user 2013
+# Licence:     <your licence>
+#-------------------------------------------------------------------------------
+#!/usr/bin/env python
+
+
+
+import itertools
+
+
+from x86Analyzer import X86AnalyzerBase
+
+class RWDict(X86AnalyzerBase):
+
+
+    # this gets MatchedCmds tuple, (rest = target (tarStr) and reference (refStr) , for debug)
+    def __init__(self,nodeGradesInfos=[]):
+        X86AnalyzerBase.__init__(self,nodeGradesInfos)
+
+        self.createRewrite()
+        self.__createBlackList()
+
+
+    def getEmptyDict(self):
+        d = X86AnalyzerBase.getEmptyDict(self)
+        for key in d.keys():
+            d[key]['entries'] = {}
+
+        return d
+
+    def commitChanges(self,tmpDict):
+        self.__mergeDictIntoSelf(tmpDict)
+
+        # this will add recorded value to dict, even if there is a conflict it will be recorded...
+    #
+    def insertToDictWithType(self,tarCmdNum,fromStr,refCmdNum,toStr,typeStr,dict2insert=None):
+        #if dict2insert == None:
+        dict2insert = self.rewriteDict
+
+        #(yo dawg i heard u like dicts...:\ the value is a counter)
+
+        if not dict2insert[typeStr]['entries'].has_key(fromStr):
+            dict2insert[typeStr]['entries'][fromStr] = {'values':dict(),'generation':self.generation}
+
+        if dict2insert[typeStr]['entries'][fromStr]['values'].has_key(toStr):
+            dict2insert[typeStr]['entries'][fromStr]['values'][toStr] += 1
+        else:
+            dict2insert[typeStr]['entries'][fromStr]['values'][toStr] = 1
+
+
+    # black list has no generation:) , we can use the rwdict type as they are the same..
+    def getRewriteWithType(self,tarCmdNum,fromStr,typeStr,FoundBlacklistElement):
+        if self.BlacklistDict[typeStr]['entries'].has_key(fromStr):
+            FoundBlacklistElement[0] = True
+
+        elif self.rewriteDict[typeStr]['entries'].has_key(fromStr):
+            if self.rewriteDict[typeStr]['entries'][fromStr]['generation'] == self.generation:
+                if len(self.rewriteDict[typeStr]['entries'][fromStr]['values']) == 1:
+                    return self.rewriteDict[typeStr]['entries'][fromStr]['values'].keys()[0]
+                else:
+                    # we are in conflict, return original
+                    return fromStr
+
+        #not found in this type's map in this generation, return original
+        return fromStr
+
+    def incGeneration(self):
+        self.generation += 1
+
+    # this will check our dict and make sure atleast one "real" entry is there
+    def isMeaningfull(self):
+        for typeStr in self.rewriteDict.keys():
+            for entry in self.rewriteDict[typeStr]['entries'].keys():
+                if len(self.rewriteDict[typeStr]['entries'][entry]['values']) == 1 and self.rewriteDict[typeStr]['entries'][entry]['values'].keys()[0] != entry :
+                    return True
+
+    # this will merge 'other' into self, only iff there are no conflicts
+    def mergeIntoSelf(self,other):
+        self.__mergeDictIntoSelf(other.rewriteDict)
+
+
+    # this will merge 'other' into self, only iff there are no conflicts
+    def __mergeDictIntoSelf(self,otherDict):
+        myDict = self.rewriteDict
+        for typeStr in [x for x in myDict.keys() if myDict[x]['Mergeable']==True ]:
+            for entry in otherDict[typeStr]['entries'].keys():
+                if myDict[typeStr]['entries'].has_key(entry):
+                    for value in otherDict[typeStr]['entries'][entry]['values']:
+                        if myDict[typeStr]['entries'][entry]['values'].has_key(value):
+                            myDict[typeStr]['entries'][entry]['values'][value] += otherDict[typeStr]['entries'][entry]['values'][value]
+                        else:
+                            myDict[typeStr]['entries'][entry]['values'][value] = otherDict[typeStr]['entries'][entry]['values'][value]
+                else:
+                    self.rewriteDict[typeStr]['entries'][entry] = otherDict[typeStr]['entries'][entry].copy()
+
+    def __getDictAsString(self,myDict):
+        outStr = []
+        out = ""
+        for typeStr in myDict.keys():
+            typePrinted = False
+
+            for entry in myDict[typeStr]['entries'].keys():
+                if len(myDict[typeStr]['entries'][entry]['values']) == 1:
+                    if myDict[typeStr]['entries'][entry]['values'].keys()[0] != entry :
+                        if not typePrinted:
+                            out += "TYPE={" + typeStr + "}-"
+                            typePrinted = True
+                        outStr.append(entry + " -> " + myDict[typeStr]['entries'][entry]['values'].keys()[0])
+                else:
+                    if not typePrinted:
+                        out += "TYPE={" + typeStr + "}-"
+                        typePrinted = True
+                    outStr.append ( entry + " -> *Conflict*")
+            out += ",".join(outStr)
+            if typePrinted:
+                out += "|"
+            outStr = []
+
+        return out;
+
+    # our print is the dict print..
+    def __str__(self):
+        return "Dict:" + self.__getDictAsString(self.rewriteDict) + " *** BlackList:" + self.__getDictAsString(self.BlacklistDict)
+
+        #return out
+
+    """
+    # this will add recorded value to dict, even if there is a conflict it will be recorded...
+    def __insertToBlackList(self,Str,typeStr):
+
+        if not self.BlacklistDict[typeStr]['entries'].has_key(Str):
+            self.BlacklistDict[typeStr]['entries'][Str] = 1
+        else:
+            self.BlacklistDict[typeStr]['entries'][Str] += 1
+    """
+
+    def __createBlackList(self):
+
+        for nodeInfo in self.nodeGradesInfos:
+
+            cmds = nodeInfo['deletedCmds']
+
+            def getCmdParams(cmd):
+                spParams = cmd.split(" ")
+                spParams.pop(0)
+                if len(spParams) > 0:
+                    comParams = list(itertools.chain(*map(lambda x: x.split(","),spParams)))
+                    return list(itertools.chain(*map(lambda x: x[1:-1].split("+") if x.startswith("[") else x.split("+"),comParams)))
+                else:
+                    return spParams
+
+            for cmd in cmds:
+                if cmd != "":
+                    # we only support var ban for now...
+                    cmdParams = getCmdParams(cmd)
+                    for param in cmdParams:
+                        if self.BlacklistDict[self.VAR]['testerFunction'](param):
+                            self.insertToDictWithType(-1,param,-1,param,self.VAR,self.BlacklistDict)
+
+
+