95b8e2a603f66cc3091e3266a717c0f206be3e95,FeatureSelection.py,,,#,34

Before Change


test_filename = "test.csv"
train_filename = "train.csv"

train_news = pd.read_csv(train_filename)
test_news = pd.read_csv(test_filename)


//we will start with simple bag of words technique 
//creating feature vector - document term matrix
countV = CountVectorizer()
train_count = countV.fit_transform(train_news["Statement"])

//print training doc term matrix
//we have matrix of size of (10240, 12196) by calling below

After Change


train_count = countV.fit_transform(DataPrep.train_news["Statement"].values)

print(countV)
print(train_count)

//print training doc term matrix
//we have matrix of size of (10240, 12196) by calling below
def get_countVectorizer_stats():

In pattern: SUPERPATTERN

Frequency: 3

Non-data size: 4

Instances

Link

Project Name: nishitpatel01/Fake_News_Detection

Commit Name: 95b8e2a603f66cc3091e3266a717c0f206be3e95

Time: 2017-12-03

Author: nkp3@illinois.edu

File Name: FeatureSelection.py

Class Name:

Method Name:

Link

Project Name: nishitpatel01/Fake_News_Detection

Commit Name: 3b49ffd98696ad697cf2b9685e581459d51ea0b1

Time: 2017-12-03

Author: nkp3@illinois.edu

File Name: FeatureSelection.py

Class Name:

Method Name:

Link

Project Name: okfn-brasil/serenata-de-amor

Commit Name: cef99445ab551931fed507518b85034b97c946ee

Time: 2016-11-09

Author: cuducos@gmail.com

File Name: src/search_suspect_places.py

Class Name:

Method Name: