用AI写代码批量整理GEO数据库中的单细胞数据

用AI写代码只批量链接GEO 10X数据:

这是下载的数据:

attachments-2025-03-3WmCXBmw67d406c09bf3e.png


这是我想要的结果:以样本名命名文件夹(3521-SR-2) 链接三个文件:

3219-SR-1
  barcodes.tsv.gz 
  features.tsv.gz 
  matrix.mtx.gz

这里的步骤关键是如何批量提取文件中的样本名字,以下是我的提示语 让ai给我生成bash命令批量完成: 

点击链接查看对话详情:

https://www.doubao.com/thread/w19bbe94b644bac3d

attachments-2025-03-GNDrRPFq67d407d9e0c20.png


给我的命令:


#!/bin/bash# 遍历当前目录下所有以 GSM 开头的文件
for file in GSM*; do
# 提取 _ 到最后一个数字的内容
identifier=$(echo "$file" | sed 's/.*_\([^_]*[0-9]\).*/\1/')
if [ -n "$identifier" ]; then
# 创建对应的文件夹,若文件夹已存在则不报错
mkdir -p "$identifier"
# 根据文件后缀判断文件类型并进行链接
if [[ $file == *barcodes.tsv.gz ]]; then
ln -s "$(realpath "$file")" "$identifier/barcodes.tsv.gz"
elif [[ $file == *features.tsv.gz ]]; then
ln -s "$(realpath "$file")" "$identifier/features.tsv.gz"
elif [[ $file == *matrix.mtx.gz ]]; then
ln -s "$(realpath "$file")" "$identifier/matrix.mtx.gz"
fi
fi
done


完美解决问题,AI真的不错,大家快来试试吧;

  • 发表于 6天前
  • 阅读 ( 93 )
  • 分类:转录组

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

715 篇文章

作家榜 »

  1. omicsgene 715 文章
  2. 安生水 354 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 84 文章
  6. rzx 81 文章
  7. 红橙子 78 文章
  8. CORNERSTONE 72 文章