ctheodoris
/

Geneformer

Model card Files Files and versions Community

Geneformer / geneformer

Commit History

update eval_strategy for new transformers version

18a2ca6

Christina Theodoris commited on about 23 hours ago

move import wandb to conditional

7e4697d

Christina Theodoris commited on about 23 hours ago

fully qualified imports to resolve name-space conflicts (#532)

5f07ec8
verified

madhavanvvs commited on 7 days ago

ddp_mtl_nccl_support (#524)

e2efe2b
verified

ctheodoris commited on 21 days ago

edit imports in perturber_utils

c6d04a6

Christina Theodoris commited on Apr 11

fix exact_mean subselection to be for index rather than col name

a13a2cf

Christina Theodoris commited on Mar 12

fix exact_mean and exact_median to subselect dataframe emb cols, not cell rows

cfc8cdb

Christina Theodoris commited on Mar 12

add quantization for pretrained model

7b591f6

Christina Theodoris commited on Mar 12

Prepare data cell level pass cell state dict instead of genes (#483)

69e6887
verified

hchen725 commited on Feb 5

ensure gene class dict only inverted when using gene classifier

54b408b

Christina Theodoris commited on Feb 5

make plot roc compatible with eval-only metrics

ae4867d

Christina Theodoris commited on Feb 1

Merge remote-tracking branch 'origin/main'

5760b30

Christina Theodoris commited on Feb 1

fix gene class dict labeling

bfcada4

Christina Theodoris commited on Feb 1

Fix how mappings and train and val data are returned (#473)

c81f6f9
verified

hchen725 commited on Jan 27

Upload gene_name_id_dict_gc95M.pkl (#470)

01d3ea8
verified

hchen725 commited on Jan 10

Add checks for custom attributes and n_counts prior to sum ensembl id (#461)

09de197
verified

hchen725 commited on Dec 4, 2024

remove unused imports while no longer using distributed sampler

b9028ba
verified

ctheodoris commited on Dec 4, 2024

Raise error for train and validation mismatch (#459)

9af94b8
verified

madhavanvenkatesh commited on Dec 4, 2024

Upload in_silico_perturber.py (#432)

cb89107
verified

davidjwen commited on Dec 3, 2024

Update geneformer/emb_extractor.py (#453)

ebc1e09
verified

hchen725 commited on Nov 22, 2024

Update geneformer/tokenizer.py (#450)

664f71e
verified

hchen725 commited on Nov 22, 2024

update isp default mode to cls

0c99403
verified

ctheodoris commited on Nov 20, 2024

update pretrainer to not use distributed sampler (Trainer uses accelerate)

8140c51
verified

ctheodoris commited on Nov 7, 2024

update function for N_Detections for mixture_model without anchor_token

df297bc

Christina Theodoris commited on Oct 25, 2024

add check to ensure emb_label is None for getting state embs dict

39b4444

Christina Theodoris commited on Oct 23, 2024

change default emb to cls

9ee140a
verified

ctheodoris commited on Oct 5, 2024

Update trainer output dir (#427)

dc23c5f
verified

hchen725 commited on Sep 28, 2024

Update geneformer/tokenizer.py (#415)

63275a8
verified

hchen725 commited on Sep 13, 2024

CUDA kernels incompatible with standard PyTorch device movement with 4bit/8bit, necessitating device-specific handling (#416)

b6d28c3
verified

madhavanvenkatesh commited on Sep 10, 2024

dictionaries from parent dir (#405)

85f295e
verified

madhavanvenkatesh commited on Sep 3, 2024

remove token dictionary and unpickling from init (#403)

7eca269
verified

madhavanvenkatesh commited on Sep 3, 2024

move dict loading to function in eval utils

57bc17e

ctheodoris commited on Sep 2, 2024

edit docs formatting

ef094b2

ctheodoris commited on Sep 2, 2024

update tokenizer to defaults for 95M models for special token and input size

da8cf3d
verified

ctheodoris commited on Sep 2, 2024

pointing dictionaries from the mtl module's init (#397)

7470753
verified

madhavanvenkatesh commited on Aug 28, 2024

Refactored token dictionary loading and encapsulated dictionary (#398)

beb62a4
verified

madhavanvenkatesh commited on Aug 28, 2024

Refactor: Convert mask_token_id, pad_token_id, and all_special_ids to properties (#395)

2e06f1a
verified

madhavanvenkatesh commited on Aug 28, 2024

sync token_dictionary variable name w/ classifier

a021deb
verified

ctheodoris commited on Aug 26, 2024

fix imports mtl/eval_utils

eab1878

ctheodoris commited on Aug 20, 2024

allow model_type valid options to take params model_type : {"Pretrained", "GeneClassifier", "CellClassifier", "MTLCellClassifier", "MTLCellClassifier-Quantized"} (#390)

47e0ef8
verified

madhavanvenkatesh commited on Aug 21, 2024

"save_model_without_heads" is redundant (#385)

de10ab0
verified

madhavanvenkatesh commited on Aug 21, 2024

comment out "def save_model_without_heads(original_model_save_directory)"; redundant for ISP/Emb extractor (#382)

22bf20f
verified

madhavanvenkatesh commited on Aug 21, 2024

fixed bug related to dynamic ranges in dictionary with 'min' and 'max' value mismatch in optuna suggest fn (#380)

fe1640b
verified

madhavanvenkatesh commited on Aug 21, 2024

precommit formatting

f07bfd7

ctheodoris commited on Aug 15, 2024

update with 12L and 20L i4096 gc95M models, multitask and quantiz code

933ca80

ctheodoris commited on Aug 15, 2024

rename for consistency

ec19834
verified

ctheodoris commited on Aug 11, 2024

delete old gene name dict

817eca2
verified

ctheodoris commited on Aug 11, 2024

update to only have gene names as keys in gene_name_id_dict

e61485e
verified

ctheodoris commited on Aug 11, 2024

Add function for summing of Ensembl IDs (#377)

1e18102
verified

hchen725 commited on Aug 11, 2024

save pval

b07f4b1

ctheodoris commited on Jul 15, 2024