5b8864d1863ac0474db8b657f023341686f4b1fb,benchmark/imdb.py,,imdb_raw,#,9

Before Change


def imdb_raw():
    index_offset = 3  // word index offset

    (x_train, y_train), (x_test, y_test) = imdb.load_data(index_from=index_offset)

    word_to_id = imdb.get_word_index()
    word_to_id = {k: (v + index_offset) for k, v in word_to_id.items()}
    word_to_id["<PAD>"] = 0

After Change




def imdb_raw():
    dataset = tf.keras.utils.get_file(
        fname="aclImdb.tar.gz", 
        origin="http://ai.stanford.edu/~amaas/data/sentiment/aclImdb_v1.tar.gz", 
        extract=True,
    )
    
    // set path to dataset
    IMDB_DATADIR = os.path.join(os.path.dirname(dataset), "aclImdb")
    
    classes = ["pos", "neg"]
    train_data = load_files(os.path.join(IMDB_DATADIR, "train"), shuffle=True, categories=classes)
    test_data = load_files(os.path.join(IMDB_DATADIR,  "test"), shuffle=False, categories=classes)

    encoding = "utf-8"
    x_train = np.array(train_data.data)
    y_train = np.array(train_data.target)
    x_test = np.array(test_data.data)
    y_test = np.array(test_data.target)
    return (x_train, y_train), (x_test, y_test)


def main():

In pattern: SUPERPATTERN

Frequency: 3

Non-data size: 10

Instances

Link

Project Name: keras-team/autokeras

Commit Name: 5b8864d1863ac0474db8b657f023341686f4b1fb

Time: 2020-09-24

Author: jhfjhfj1@gmail.com

File Name: benchmark/imdb.py

Class Name:

Method Name: imdb_raw

Link

Project Name: ncullen93/torchsample

Commit Name: d000bae3a03681b11818e98c29a64a145e0ff1ec

Time: 2017-04-20

Author: ncullen@modv-vlan533.0018.apn.wlan.med.upenn.edu

File Name: torchsample/modules/example.py

Class Name:

Method Name: