春和景明,波澜不惊

业精于勤荒于嬉

My Origin of Life

阿篱的元年

我想对我的半年进行一个总结,这次我想对我的未来说一声,hello! 这里是凌晨0:31分。我开始写我三个月没有更新过的博客。因为我这半年真的事情非常多。也错过了很多机会,面临过很多诱惑和选择。 18年暑假,我刚刚从新加坡回来,和易老师一起玩耍了(对于我来说,学想学的东西就是‘玩耍’)一阵,这一阵的事情是我所不能理解的。易老师给我推荐了一份来自Eric Xing的internship,Xi...

Study on sc-RNA-seq

单细胞基因的处理问题

第一步是对高维数据的约减,常用的方法有PCA, tSNE, ZIFA and CIDR. (但是在进行降维时,我们必须要用填补的方法处理为0的seq)。所以我们涉及的工作内容如下 simulation dropoout & imputation dimensional reduction & clustering 什么是 bulk-RNAs...

Clustering

A Kind Of Unsupervised Learning

一般来说做聚类是一种无监督学习方法,我们在一定的维度变化的,里面将所有的信息进行整合,然后对该整合结果进行一种映射变换,使之能够反映出不同的subclass 之间的差别,然后利用这个差别来对整块数据的划分。 那么我们注意到,为什么要对原始数据进行维度变化等trick处理呢?原因如下:在原先的数据表达上面,我们很难直接对数据进行划分。。我们无法对很大维度或者很均匀的数据进行划分。由此得有维数...

DCGAN

Deep Convolutional Network In GAN

论文的题目是representation learning ,我学到这儿了,居然连什么是representation learning都不知道。。。。此坑待填

迁移学习

Learn one point and use it in many projects

我们在处理小样本材料的时候,怎么样才能做到和训练数千万的样本相同的效果呢,现在我们有一个叫做迁移学习的思想来解决小样本问题! 又引入一次我在大创申请里面写的 基于ImageNet的迁移学习。ImageNet是由斯坦福大学的李飞飞教授带头创建的深度学习图片库,提供了超过1000种常见图片的分类。超过1400万的图像URL被ImageNet手动注释。我们将使用VGG或者GoogleNet...

VGG's Implement Using Tensorflow

Stronger Network In Computer Version

VGG是2014年ImageNet挑战赛的第一名,也是深度学习在计算机视觉的一个重要节点。由于在SRGAN实验中,需要用VGG来抽取样本的特征,并通过该网络来计算一个损失参数。由此我必须重现一个VGG,可是在现今预训练好的网络中都是用传统的RGB来训练ImageNet的数据的,我需要重写一个demo,使其拥有训练灰度图像的能力 这篇博客包括了VGG的结构,VGG的能力,VGG的代码实现,I...

DNA Project Notes

First step to bioinformation,solve sequences classification using overfitting of LSTM

I can not tell you until all the work is down. 传统的方法中我们使用字符串匹配算法从巨量的数据库中对宏基因进行比对和确定,但是这么一来,无论如何优化传统的查找匹配的数据结构,增加内存占用,多设置几个哈希表,设置几个分类树结构,都是毫无新意的“老套路”。但是我们若使用LSTM和CNN对大批量的原始数据进行过拟合,无论学习到排序信息或者高维度的蛋白...

Heap

advandced structrue

这个设计的数据结构学习一下,严媦敏奶奶的书上面没有关于堆的东西,索性记录一下学习…… Binomial Trees Binomial Heap Fib heap太重要了,回去补课

Cloud-Programming

Use Paas to create something

首先我们上了一天的类似于软件工程的课程,老师念了接近100页的PPT,我真的很佩服他的备课能力。 并且透露一个信息,在最好的学校里面也有这种记忆科目,全靠背……其实大家都很累。只是拒绝这个的只有你一个人…… mapreduce : map,将计算任务分开,reduce,将output合并得到一个结果 hadoop,分布式计算 Sad to notice:passage ends here...

Programming using CUDA & Geometry

Solve problems with thousands of Cpus

CUDA编程哈,第一次接触,关于gpu的使用问题,以及几何学 render 渲染 meshing calling compactions 压缩 transform_reduce map_reduce map:映射 reduce:规约 GPU编程的目的应该是将一个问题转换成数千个流处理器能并行处理的方法然后利用GPU的硬件特性处理问题 cpu和gpu的配合解决问题,solve probl...