5b8864d1863ac0474db8b657f023341686f4b1fb,benchmark/imdb.py,,imdb_raw,#,9

Before Change


    word_to_id["<UNK>"] = 2

    id_to_word = {value: key for key, value in word_to_id.items()}
    x_train = list(
        map(lambda sentence: " ".join(id_to_word[i] for i in sentence), x_train)
    )
    x_test = list(
        map(lambda sentence: " ".join(id_to_word[i] for i in sentence), x_test)
    )
    x_train = np.array(x_train, dtype=np.str)

After Change


    )
    
    // set path to dataset
    IMDB_DATADIR = os.path.join(os.path.dirname(dataset), "aclImdb")
    
    classes = ["pos", "neg"]
    train_data = load_files(os.path.join(IMDB_DATADIR, "train"), shuffle=True, categories=classes)
    test_data = load_files(os.path.join(IMDB_DATADIR,  "test"), shuffle=False, categories=classes)

    encoding = "utf-8"
    x_train = np.array(train_data.data)

In pattern: SUPERPATTERN

Frequency: 3

Non-data size: 9

Instances

Link

Project Name: keras-team/autokeras

Commit Name: 5b8864d1863ac0474db8b657f023341686f4b1fb

Time: 2020-09-24

Author: jhfjhfj1@gmail.com

File Name: benchmark/imdb.py

Class Name:

Method Name: imdb_raw

Link

Project Name: jhfjhfj1/autokeras

Commit Name: 5b8864d1863ac0474db8b657f023341686f4b1fb

Time: 2020-09-24

Author: jhfjhfj1@gmail.com

File Name: benchmark/imdb.py

Class Name:

Method Name: imdb_raw

Link

Project Name: chartbeat-labs/textacy

Commit Name: 03e098c84a14309b87528ef21ccb5e4f834de5f5

Time: 2020-03-01

Author: burtdewilde@gmail.com

File Name: setup.py

Class Name:

Method Name: