AI 开源项目分享：pytorch 增强图像数据、Tensorflow 2.0 实现...

文末免费送电子书：七月在线干货组最新升级的《名企AI面试100题》免费送！

项目一：igel — 无需编写代码即可训练，测试和使用模型

一个令人愉悦的机器学习工具，可让您无需编写代码即可训练/拟合，测试和使用模型。

该项目的目标是为技术用户和非技术用户提供机器学习。

有时我需要一个工具，可以用来快速创建机器学习原型。是构建概念验证还是创建快速草图模型来证明这一点。我发现自己经常被困在编写样板代码和/或想太多如何启动它。

因此，我决定创建igel。希望它将使技术和非技术用户更轻松地构建机器学习模型。

igel建立在scikit-learn之上。它提供了一种无需编写任何代码即可使用机器学习的简单方法。

您所需要的只是一个yaml（或json）文件，您需要在其中描述您要执行的操作。而已！

Igel支持sklearn的所有机器学习功能，无论是回归，分类还是聚类。准确地说，您可以在igel中使用63种不同的机器学习模型。

Igel支持数据科学领域中最常用的数据集类型。例如，您的输入数据集可以是您要获取的csv，txt，excel表格，json甚至是html文件。所有这些类型均受igel支持。在后台，igel使用熊猫读取您的输入数据集并将其转换为数据框。

项目的点：

从GUI使用
支持大多数数据集类型（csv，txt，excel，json，html）
支持所有最新的机器学习模型（甚至是预览模型）
支持不同的数据预处理方法
在编写配置时提供灵活性和数据控制
支持交叉验证
支持两种超参数搜索（版本> = 0.2.8）

支持yaml和json格式

支持不同的sklearn指标以进行回归，分类和聚类

支持多输出/多目标回归和分类

支持多处理并行模型构建

支持模型： 在这里插入图片描述 项目地址：

https://github.com/nidhaloff/igel

在这里插入图片描述

薅羊毛啦！七月在线【AI提升季】，【机器学习集训营】【推荐系统高级小班】【CV高级小班】【推荐系统入门】【深度学习入门】【机器学习入门】六大集训营、高级小班课程限时免听！在这里插入图片描述 另外参与活动还可获得：机械键盘、SSD硬盘、七月VIP、AI经典纸质书等，100%有奖! 活动主会场：https://www.julyedu.com/active/assistance/AItisheng

项目二：zindi_wheat_growth — CGIAR小麦生长阶段挑战赛的第一名解决方案

问题是根据农民发送的图像估算小麦作物的生长阶段。模型必须获取图像，并以1（仅显示作物）到7（成熟作物）的比例输出显示的小麦生长阶段的预测。

数据集具有两组标签：不良和良好的质量，但是测试数据集仅由高质量的标签组成。首先，不良标签和良好标签之间没有明确的对应关系（良好标签仅包含5个类别：2、3、4、5、7）。

其次，使用简单的二进制分类器可以轻松地区分劣质图像。因此，它们来自不同的分布。查看这种模型的Grad-CAM可以发现，两组图像之间的主要区别在于这些白棒（极）：在这里插入图片描述 这就是训练过程包括两个步骤的原因：

结合不良和优质标签对模型进行预训练
仅在优质标签上微调模型

模型超参数：

架构：ResNet101
问题类型：分类
损失：交叉熵
FC退出率：0.3
输入大小：（256，256）
预测的概率乘以类别标签并求和

数据增强：

水平翻转
随机亮度对比
ShiftScaleRotate
模仿图像上的其他白棒（杆）
标签扩展（以较低的可能性将类标签更改为邻居类）
使用水平翻转作为TTA

训练过程

预训练好和坏标签的混合，共10个时期
微调优质标签，持续50个时期，降低高原学习率

系统环境：

OS: Ubuntu 16.04
Python: 3.6
CUDA: 10.1
cudnn: 7
pipenv

项目地址：

https://github.com/ybabakhin/zindi_wheat_growth

项目三：Vision-Transformer — Vision Transformer Tensorflow 2.0实现

尽管Transformer体系结构已成为自然语言处理任务的实际标准，但其在计算机视觉中的应用仍然受到限制。

在视觉上，注意力要么与卷积网络结合应用，要么用于替换卷积网络的某些组件，同时保持其整体结构不变。

我们表明，这种对CNN的依赖不是必需的，并且当直接应用于图像补丁序列时，纯转换器可以很好地执行图像分类任务。

当对大量数据进行预训练并传输到多个识别基准（ImageNet，CIFAR-100，VTAB等）时，与最先进的卷积网络相比，Vision Transformer可获得出色的结果，而所需的计算资源却大大减少训练。在这里插入图片描述

项目地址：

https://github.com/kamalkraj/Vision-Transformer

项目四：tormentor — 用pytorch增强图像数据

在这里插入图片描述

设计原则

简化扩充的定义
每个扩充类的每个实例都是确定性的。
输入和输出是pytorch张量，而pytorch在所有计算中都更可取。
默认情况下，所有数据均为4D：[批处理x通道x宽度x高度]。
单个样本扩充：批次大小必须始终为1。
线程安全：每个扩充实例都必须是线程安全的。
输入/输出仅限于一个或多个2D图像通道。
增强要么保留通道，要么保留像素（空间）。
增强类也将其工厂作为类方法
限制对torch和kornia的依赖（至少对于核心软件包）。

项目地址：

https://github.com/anguelos/tormentor

帮助数千人成功上岸的《名企AI面试100题》书，电子版，限时免费送，评论区回复“100题”领取！没毛病

本书涵盖计算机语⾔基础、算法和⼤数据、机器学习、深度学习、应⽤⽅向 (CV、NLP、推荐、⾦融风控)等五⼤章节，每⼀段代码、每⼀道题⽬的解析都经过了反复审查或review，但不排除可能仍有部分题⽬存在问题，如您发现，敬请通过官⽹/APP七月在线 - 国内领先的AI职业教育平台 (julyedu.com)对应的题⽬页⾯留⾔指出。

为了照顾⼤家去官⽹对应的题⽬页⾯参与讨论，故本⼿册各个章节的题⽬顺序和官⽹/APP题库内的题⽬展⽰顺序保持⼀致。只有100题，但实际笔试⾯试不⼀定局限于本100题，故更多烦请⼤家移步七⽉在线官⽹或七⽉在线APP，上⾯还有近4000道名企AI笔试⾯试题等着⼤家，刷题愉快。在这里插入图片描述

AI 开源项目分享：pytorch 增强图像数据、Tensorflow 2.0 实现...

项目一：igel — 无需编写代码即可训练，测试和使用模型

项目二：zindi_wheat_growth — CGIAR小麦生长阶段挑战赛的第一名解决方案

项目三：Vision-Transformer — Vision Transformer Tensorflow 2.0实现

项目四：tormentor — 用pytorch增强图像数据

相似文章推荐

评论 (0)